説明

Fターム[5B075NR16]の内容

検索装置 (67,127) | データ整理 (4,076) | 整理内容 (2,249) | 情報圧縮処理 (51)

Fターム[5B075NR16]に分類される特許

1 - 20 / 51


【課題】スパース表現クラス分類に要する計算量を削減すると共に分類精度を低下させずに高速にクラス分類を行う。
【解決手段】クラス分類装置1において、訓練データ分割手段11はスパース表現クラス分類を行うクラス分類手段10で得られた訓練データをセンシング行列候補データと検証データとに分割する。寄与率計算手段13は前記センシング行列候補データに含まれる各候補アイテムの正解分類への寄与率を算出する。センシング行列作成手段14は前記候補アイテムの寄与率の値に基づき選択された候補アイテムを成分とするセンシング行列を作成する。センシング行列更新手段15は最新の訓練データのセンシング行列候補データと当該訓練データ由来の検証データとの線形的な制約を満たす解の係数に基づき従前のセンシング行列に含まれる各候補アイテムの寄与率を更新しこの更新した寄与率の値に基づき当該センシング行列を更新する。 (もっと読む)


【課題】 情報精度を低下させることなく圧縮効率が高いデータ圧縮装置を提供することを目的とする。
【解決手段】 データ圧縮装置1は,項目の情報が一致する場合の一致の重みと情報精度の保持レベルを示す同一視判定テーブル,各項目の情報の分布と保持レベルから決定する元本保持レベルを示す情報精度決定テーブルおよびデータ間での一致の重みの分布と出現数をもとグループ化の条件を示す同一視判定テーブルを記憶する記憶部10と,イベントデータ2のデータ群の各々に対し,設定情報をもとに同一視できるデータ同士をグループ化するグループ分割部11と,各グループで,項目の情報の分布を求め,設定情報をもとに,各項目の元本保持レベルを決定する情報精度決定部13と,元本保持レベルに応じてデータの情報を書き換えるイベント変換部15と,変換されたデータを含むデータ群を圧縮するデータ圧縮部17とを備える。 (もっと読む)


【課題】ヒストグラムを高速に生成する技術を提供する。
【解決手段】ヒストグラム生成装置は、ヒストグラム生成のための対象データに基づいて、ヒストグラムの各区間を決めるための分割点の候補となる複数の分割候補点を決定する決定手段と、当該各分割候補点における上記対象データの頻度の変化値をそれぞれ計算する変化値計算手段と、この変化値計算手段で計算された各変化値に基づいて上記複数の分割候補点をサンプリングすることにより、上記決定手段により決定された分割候補点の数よりも少ない数の分割候補点を選択する選択手段と、この選択手段により選択された分割候補点を用いて上記対象データのヒストグラムを生成するヒストグラム生成手段と、を備える。 (もっと読む)


【課題】与えられたキーワードを含む電子文書の数(DF値)を、少ないメモリ使用量で高速に計算できる文書検索装置を提供する。
【解決手段】入力された複数の検索キーワードの各々の重要度を用いて、複数の文書から所望の文書を検索する文書検索装置であって、複数の文書の各々に含まれる文字列に対する接尾辞配列を構築し、接尾辞配列の各接尾辞と、各接尾辞と同じ文書に由来し、且つ、辞書順序で一つ前又は後の接尾辞と、を先頭の文字から順番に比較した場合に一致する文字の数を、各接尾辞に対応する要素とする整数配列を構築し、構築された整数配列において、入力された複数の検索キーワードの各々で始まる接尾辞に対応する要素のうち、検索キーワードの文字数より小さい値の要素の数を、当該検索キーワードを含む文書の数として算出し、算出された文書の数を用いて、当該検索キーワードの重要度を計算する。 (もっと読む)


【課題】一連の値を効率よく圧縮する。
【解決手段】予測器10(予測部)は、入力データの先行する値から後続する符号化対象値の予測値を決定する。オフセット量決定部20(予測残差算出部・予測残差分類部・基準値算出部)は、予測値の予測誤差の分布に基づいて、予測誤差からの距離が最小となるような予測誤差代表値の集合を決定する。基準値生成部30は、予測値と予測誤差代表値の集合を元に、複数の残差基準値を決定する。最小残差選択部40(基準値選択部・符号化部)は、複数の残差基準値の中から、符号化対象値に最も近いものを選択して、該誤差基準値と符号化対象値の差を残差(基準残差)として出力するとともに、選択した残差基準値のインデックス(選択基準値符号)を圧縮データに出力する。残差符号化部50(符号化部)は、残差を符号語(基準残差符号)に変換して圧縮データに出力する。 (もっと読む)


【課題】 利用者が与える任意の指定文字列に関連するか否かをにより入力テキスト(マイクロブログテキスト)を分類する。
【解決手段】 本発明は、入力テキストに指定文字列が含まれるか否かを判定し、指定テキスト記憶手段に格納されているテキスト集合を連結した指定連結テキストと、該指定連結テキストと入力テキストを連結したテキストと、比較テキスト記憶手段に格納されているテキスト集合を連結した比較連結テキストと、該比較連結テキストと該入力テキストを連結したテキストを連結テキスト記憶手段に出力し、連結テキスト記憶手段に格納されている連結したテキストをそれぞれデータ圧縮し、圧縮後のデータサイズを求め、これを基に、入力テキストの、指定文字列への関連スコアを求めスコア出力手段の関連スコアに基づいて、入力テキストを指定文字列に関連するか否かを分類する。 (もっと読む)


【課題】画像検索サーバが検索対象とする画像情報を効率良く記憶すること。
【解決手段】通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を記憶する画像情報記憶部と画像情報記憶部に記憶されている画像情報が端末装置へ通信網を介して送信されたログを記憶するログ記憶部と、前記画像情報の送信頻度を前記ログより算出し、画像提供装置より画像情報の再読み込みを制御する再読込制御部と、再読込制御部の制御により画像提供装置より対応する画像情報の再読み込みをして、第1の読み込みのときに画像情報記憶部に記憶されたときより情報量を増加させて画像情報記憶部に記憶しなおす画像情報再読込部とを有する画像検索サーバを提供する。 (もっと読む)


【課題】重要な区間を含んだ要約映像を作成できる。
【解決手段】映像処理装置は、取得部、第1抽出部、生成部、第2抽出部、算出部、及び選択部を含む。取得部は、画像および音響を含む複数の映像を取得する。抽出部は、映像ごとに、画像及び音響のうちの少なくとも1つを解析し、特徴量を抽出する。生成部は、特徴量の変化に応じて映像を分割して複数の区間を生成し、互いに異なる映像に含まれる1以上の区間の特徴量の類似度が閾値以上の区間を複数の映像間で対応付けて対応区間を生成する。抽出部は、対応区間を含む映像の数が閾値以上である場合、対応区間を共通映像区間として抽出する。算出部は、共通映像区間の特徴量を用いて、共通映像区間で定義され時間を変数とするスコアであって共通映像区間に含まれる映像部分を要約映像に含める度合いを示す要約スコアを算出する。選択部は、要約スコアに基づいて、要約映像に用いる要約区間を選択する。 (もっと読む)


【課題】一般的な書籍の読者に対しても、読み進んだ箇所に対応する電子的な要約を提供する。
【解決手段】書籍の書籍識別情報に関連付けられて、書籍の寸法、総頁数、頁数に対応した要約が格納されたテーブルを複数備えた書籍データベースと、
カメラと、表示部と、を備えた小型携帯機器と、
前記カメラにより撮影された、しおりが挟まれた状態の前記書籍の映像から書籍の寸法を抽出する画像寸法抽出部と、前記書籍の書籍識別情報を取得する書籍識別情報取得手段と、該書籍識別情報取得手段により得られた書籍識別情報に対応する前記書籍データベースのテーブルより前記書籍の寸法および総頁数を取得し、前記画像寸法抽出部により得られた前記書籍の寸法から前記しおりが挟まれた頁数を求め、求めたページ数に対応する要約を前記テーブルから読み出して前記小型携帯機器の表示部へ出力させる画像寸法解析部と、を備えた要約出力部と、を有する。 (もっと読む)


【課題】ユーザの行動履歴だけでなくユーザの属性情報をも利用することによって、購買頻度が低く行動履歴情報が少ない場合における推薦精度を向上させる。
【解決手段】ユーザ×コンテンツ行列を生成する行列生成部と、前記ユーザ×コンテンツ行列に基づき、ユーザ圧縮行列とコンテンツ圧縮行列とを初期設定する初期値設定部と、前記ユーザ圧縮行列に前記ユーザの属性情報を加算し、ユーザ圧縮属性情報加算行列を生成する属性情報加算部と、前記ユーザ圧縮属性情報加算行列と前記コンテンツ圧縮行列とを更新する更新処理部と、前記ユーザ圧縮属性情報加算行列とコンテンツ圧縮行列とから復元ユーザ×コンテンツ行列を計算し、前記ユーザ×コンテンツ行列との差分が所定の閾値以下であるか判断する更新判定部とを有し、前記更新判定部は、前記差分が前記所定の閾値以下である場合には前記復元ユーザ×コンテンツ行列を推定された行列とするコンテンツ推薦装置。 (もっと読む)


【課題】 インターネット上の文書から、正当な引用を行なっている文書を含めたオリジナルな文書の抽出を可能にする。
【解決手段】 複数の文書に含まれる文字列から、この文字列の一部をなす部分文字列を文書毎に生成する部分文字列生成手段と、前記部分文字列生成手段により生成された前記部分文字列の内、自らが生成された文書以外の文書に含まれない部分文字列を一意部分文字列として判定する一意部分文字列判定手段と、文書毎の総部分文字列数と前記一意部分文字列判定手段により判定された前記一意部分文字列数との比が所定の範囲にある文書を不要文書として検出する不要文書検出手段とを備える。 (もっと読む)


【課題】与えられた文章に依存してスニペットを動的に生成する方法を提供する。
【解決手段】スニペット生成装置11では、クエリ解析部14が、与えられた文章を形態素解析して形態素に分解し、各形態素の活用語形を考慮したパターンを正規表現に変換し、重要文選択部16が、対象となる文書に対しパターン検索を行い、正規表現の出現頻度を計測し、正規表現の文書内出現頻度と文書出現頻度とに基づいて文書を構成する文のスコアを計算し、スコアの高い順に上位n個の文を選択し、文縮約部17が、n個の文から指定された文字数になるように不必要な部分を削除してスニペットとする。 (もっと読む)


【課題】ユーザのコメントをできるだけ反映させつつ、記事の作成者等に予期せぬ被害を与えることを防ぐ装置を提供する。
【解決手段】記事管理装置1は、記事の閲覧要求を受け付ける閲覧要求受付部11と、閲覧要求された記事を記事データベース21から抽出する記事抽出部12と、その抽出した記事に付された複数のコメントを、辞書データベース22を参照して解析し、同義語及び類義語が含まれることにより、最初のコメントと重複する複数のコメントのうち、最初に投稿されたコメントを表示し、当該最初に投稿されたコメントが投稿された日時から一定の期間内に投稿された、最初に投稿されたコメントと重複するコメントを非表示にするように集約する記事集約部13と、その集約したコメントが付された記事を、閲覧要求したユーザ端末2に送信する記事送信部14とを備える。 (もっと読む)


【課題】フレーズレベルの同義又は類義関係の認識を容易にするために、フレーズの特徴量の有意性を維持又は向上させながら特徴量の次元を圧縮すること。
【解決手段】複数の文を有する文集合、及び上記文集合に含まれる複数のフレーズを取得するデータ取得部と、上記データ取得部により取得される各フレーズの特徴を表すフレーズ特徴量を決定するフレーズ特徴量決定部と、上記文集合の特徴を表す集合特徴量を決定する集合特徴量決定部と、上記フレーズ特徴量よりも次元の低い圧縮フレーズ特徴量であって、上記データ取得部により取得される各フレーズの特徴を表す上記圧縮フレーズ特徴量を、上記フレーズ特徴量と上記集合特徴量とを用いて生成する圧縮部と、を備える情報処理装置を提供する。 (もっと読む)


【課題】基本文に詳細文の文字列を挿入する場合、係り受け構造に変化が生じない要約文を生成するフレーズ自動挿入装置を提供する。
【解決手段】係り受け整合度記憶部は、表現同士の係り受けの整合度を記憶する。フレーズ挿入位置候補検出部は、挿入先の文のフレーズ間および文先頭等を、挿入位置候補として検出する。フレーズ挿入位置決定部は、係り受け構造データと係り受け整合度記憶部から取得する係りやすさの整合度とに基づき、フレーズ挿入位置候補に挿入フレーズを挿入したときに第1の文データの係り受け構造を壊すか否かを判定し、係り受け構造を壊さないフレーズ挿入位置候補を検出した場合に当該フレーズ挿入位置候補に挿入フレーズを挿入する。 (もっと読む)


【課題】 電子文書内にフォントデータを格納するようにした場合、ファイルサイズが増加してしまうという問題があった。また、描画するテキストの位置が、文書画像中の各文字画像の位置と合うようにしたい。
【解決手段】 本発明では、文書画像内の複数の文字画像に対して文字認識処理を行い、各文字画像に対応する文字コードを得る。幅の異なる複数種類の字形データの中から、各文字画像の文字の幅(或いは文字送り幅)に適合する字形データの種類を選択する。次に、文書画像と、文字認識して得た複数の文字コードと、複数の異なる文字コードで共通利用させるための複数種類の字形データと、複数の文字コードの描画の際に使用する前記選択した字形データの種類を示すデータとを格納した電子文書を生成し、指定された送信先へ送信する。 (もっと読む)


【課題】コンテンツデータの利用に際し、類似しているコンテンツが複数あるような場合であっても、精度よく同一性の判定を行う。
【解決手段】第1の関数により、デジタルコンテンツデータから、デジタルコンテンツデータの内容に関する特性に基づいて抽出される要素データを算出する第1関数演算部111と、第2の関数により、デジタルコンテンツデータから、デジタルコンテンツデータのビット配列に基づいて抽出されるダイジェストデータを算出する第2関数演算部112と、デジタルコンテンツデータから抽出された要素データと同一又は近似する要素データを検索し、同一又は近似する要素データに関連づけられたダイジェストデータを取得する検索部と、検索したダイジェストデータとの同一性を比較する照合部231と、検索部による検索結果が複数ある場合に、複数のダイジェストデータを関連づける関連情報を登録する関連情報登録部400とを備える。 (もっと読む)


【課題】 XMLデータに対する問合せにおいて、無駄なリンクの参照をなくして、効率よく問合せの処理を行う装置を提供することを目的とする。
【解決手段】 検索の対象となるXMLデータの登録時に、XMLデータローダ部230が、XMLデータの要約情報を構成し、前記要約情報に範囲ラベルを付与して、二次記憶装置130に記憶する。検索時に、XMLデータに対する問合せと要約情報を入力として、問合せ解析部150が、前記問合せを木構造に変換して値の部分を削除した問合せ木の構造部を生成し、問合せ実行部170が、中間問合せ木と要約情報を照合して中間要約木の集合を生成し、前記XMLデータに対して前記中間要約木の集合を実体化したデータを含む実体中間木の集合に変換し、前記XMLデータに対して、前記実体中間木の集合に対応する値の部分を用いてフィルタ処理を行い、問合せ結果を出力する。 (もっと読む)


【課題】文書中の検索クエリと関連の高い領域のみをコンパクトに圧縮して表示するとともに、閲覧漏れのリスクを抑える。
【解決手段】検索キーと関連度の高い部分領域を表示するために、文書を部分領域(ブロック)に分割し、ブロック単位の検索を行い、検索結果のブロック集合から特徴度を持った特徴ベクトルを生成し、その特徴ベクトルとの類似度が高いブロックを追加表示する。非表示ブロックの内容を表すラベルを生成するために、文字列もしくは文字列の種類を表すタグごとに、表示ブロックにおける文特徴度と、非表示ブロックにおける特徴度の和を重要度とし、重要度の高いものを非表示ブロックのラベルとして表示する。 (もっと読む)


【課題】動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、有用な検索用メタデータの作成を容易とする。
【解決手段】画像情報処理装置は、動画像あるいは静止画像に関連づけられた関連コンテンツから動画像あるいは静止画像を検索するのに用いる原検索用メタデータを抽出し、メタデータ候補記憶部を参照して、原検索用メタデータから検索用メタデータのフィルタリングを行い、原検索用メタデータを動画像あるいは静止画像に付与すべき検索用メタデータとする。 (もっと読む)


1 - 20 / 51