説明

Fターム[5B009QA06]の内容

文書処理装置 (8,318) | 文体校正(推敲) (1,272) | 文体構造の管理 (601)

Fターム[5B009QA06]の下位に属するFターム

Fターム[5B009QA06]に分類される特許

141 - 160 / 572


【課題】 複数の文書要素を含む構造化文書同士の同一性判定において、文書要素群の並び順の差異によらずして同一性を判定可能な技術を提供する。
【解決手段】 前処理部11が、入力されたSOAPエンベロープのSOAPヘッダから旧ハッシュ値を取得しておく。そして、正規化対象特定部13がSOAPボディ中の処理対象の文書要素群を特定し、文書構造正規化処理部14が所定の基準に従って文書要素群を並べ替え処理し、ハッシュ値算出部15が当該並べ替え後の文書要素群からハッシュ値を算出する。その後、ハッシュ値比較部16がSOAPヘッダから取得した旧ハッシュ値と前記算出したハッシュ値とを比較して、一致する場合には構造化文書の改変がなされていないと判定する。 (もっと読む)


【課題】返信メールの応答するテキスト部分が他者からの電子メールのどの部分に対応しているのか理解しやすくする。
【解決手段】メール送受信装置10A,10Bは、返信メールのテキスト部分と、参照メールのテキスト部分と、返信メールのテキスト部分と参照メールのテキスト部分との対応関係を規定する構造データと、を含む電子メールを作成する返信メール作成手段30と、返信メールのテキスト部分と、参照メールのテキスト部分と、返信メールのテキスト部分と参照メールのテキスト部分との対応関係を規定する構造データと、を含む電子メールを受信した場合に、構造データに基づいて返信メールのテキスト部分および参照メールのテキスト部分の対応関係を認識し、互いに対応関係にあるテキスト部分を、対応テキスト確認用の表示手法で表示する受信メール表示手段20と、を備える。 (もっと読む)


【課題】表記揺れなどが頻出するような抽出対象においてもWrapperを生成することを可能とし、また、どのページから情報を抽出するかを入力せずに抽出することを可能にする。
【解決手段】本発明は、サンプルデータ、文書集合、抽出したい情報を定義した属性データを入力し、サンプルデータを学習させ、属性データを付与して抽出すべき語を判定し、抽出すべき語に対して最も特殊なWrapperを生成し、生成されたWrapperの類似度に基づいてクラスタを生成し、生成されたクラスタ内でWrapperを任意の方法で一般化し、記憶手段に格納する。 (もっと読む)


【課題】文書管理において、1つのレンディションを複数のセクションにまたがって関連付けることができるようにする。
【解決手段】レンディションをもつ文書を管理できる文書管理システムにおいて、利用者からのレンディション追加指示を受けたドキュメント管理部11からのメッセージを受け、インデックス管理部12は必要に応じて1つまたは2つのインデックスを生成することにより1つのドキュメントを構成しているセクション列をそのインデックスで分割して当該1つのレンディションに対応したセクション列を生成する。このとき、インデックス管理部12の指示でレンディション管理部13が当該レンディションのコンテンツを生成し、インデックス管理部12はそのレンディションコンテンツを当該セクション列の直前の当該インデックスに登録する。 (もっと読む)


【課題】ハイパーテキストが直接または間接的にリンクしている他のハイパーテキスト群のアンカー情報がリンク元のアンカー情報から見て適切な場合にのみリンクを張る。
【解決手段】元ハイパーテキスト中の処理範囲に存在する元アンカー72のリンク先ハイパーテキストを取得し、リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出する。元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定し、元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、マッチ範囲文字列「製品情報」と新規リンク先URLとのペアから成る新規アンカー情報を生成し、元ハイパーテキストのマッチ範囲文字列に新アンカー102を付与して新ハイパーテキスト70−1に変換する。
(もっと読む)


【課題】構造化文書を構成する文字の特徴に基づいて、該構造化文書から文書構造を抽出する。
【解決手段】まず、情報蓄積部1dが、文字の特徴に基づいて文書構造を特定し判定する判定基準を記憶する。次に、情報解析部1cが、構造化文書を解析し、文章と該文章を構成する文字の特徴を抽出する。そして、情報解析部1cが、その抽出された文字の特徴を、前記判定基準に照合し判定して文書構造を特定し抽出する。 (もっと読む)


【課題】 本発明は、表中の一部の項目を強調した場合に、強調された部分の行や列の要素名に類似した言語表現を含むテキストを抽出し、検索に利用することによって、文書中の表または表の一部を精度良く検索できるようにすることを目的とする。
【解決手段】 本発明は、表の行や列の要素名を抽出し、表中で強調されている項目を抽出し、表の項目に関する行や列の要素名を基に、表に関するメタデータを抽出する。 (もっと読む)


【課題】調理レシピから抽出した調理手順の記載内容を均一化すること。
【解決手段】自然言語で記述された調理レシピを解析する手段(10)と、前記解析結果に従って、調理の手順を抽出する手段(21)と、前記調理手順に対応する細かい調理手順が登録されたデータベース(24)と、調理レシピで明文化されていない調理手順であって、前記データベースに登録された調理手順を追加するように前記調理手順を展開する手段(22)と、を備えた。 (もっと読む)


【課題】表示装置の種類に応じて、デザイナが意図する位置でページを分割させるための簡便な方法を提供すること。
【解決手段】コントローラ10は、HTMLテキストに予め挿入されている、所定の文法に従ったコメント文を検索し、検索したコメント文の挿入されている箇所において、HTMLテキストの分割をし、分割をしたそれぞれのテキストに対して、分割により失われたHTMLテキストの属性データを補完し、新たなHTMLテキストを生成する。 (もっと読む)


【課題】業務システムに毎回異なる構造化文書が入力される場合にも、高速な構文解析を行うことができるようにする。
【解決手段】構造化文書の構文解析を行うXMLパースプログラム103に、「構造化文書中の頻出文字列」の構文解析結果を保存する解析結果テーブル115を付加する。プログラム103に、単純型要素可能性判定部116、解析結果取り出し部117、解析結果登録部118を付加する。解析結果取り出し部117は、構文解析時、構造化文書中の頻出文字列の2回目以降の出現時には格納した要素オブジェクトを解析結果テーブル115から取り出して再利用させる。 (もっと読む)


【課題】ページ内の文字列等のオブジェクトに一人あるいは複数人が下線、マーカ、イタリック、ボールド等の強調表示や、コメント、関連記事等の注釈情報を含む付加情報を加えることができ、それらをページ閲覧時に一望のうちに見えるようにして、システム利用者各人の関心のあり方を可視化することのできるページ付加情報共有管理方法を提供する。
【解決手段】複数のユーザが任意のページ内のオブジェクトに対して強調表示および必要なコメントを含む付加情報を付し、複数のユーザがその付加情報を共有するための管理方法であって、ページ内のオブジェクトに対する範囲指定を含む付加情報の設定を受け付ける受付工程と、受け付けた付加情報を対象となるページと対応付けて保存する保存工程と、付加情報の表示が要求された場合に、閲覧するページに対応する付加情報を取得し、要求元に提供する提供工程とを備える。 (もっと読む)


【課題】 検証処理を効率化できる構造化文書検証装置および構造化文書検証方法を提供する。
【解決手段】 入力された構造化文書が対応する文書スキーマに記述された条件を満たしているか否か検証後に、前記構造化文書または前記構造化文書の一部、および前記条件の少なくともいずれかに対して検証結果に影響する変更が加えられたか否かを判定する判定手段と、前記判定手段によって変更が加えられたと判定された場合、前記構造化文書または前記構造化文書の一部が前記条件を満たしているか否かを検証して該検証結果を出力する出力手段と、前記入力された構造化文書から、前記判定手段の処理対象にすると処理効率が低下する構造化文書または構造化文書の一部を前記判定手段の処理を実行しないで前記出力手段の処理の対象とする判定除外対象として特定する特定手段とを備える。 (もっと読む)


【課題】各ページに小組をある程度の自由度をもって配置することを可能とするデータベースパブリッシング方法及びその装置を提供する。
【解決手段】コンピュータが、各ページテンプレートに1又は2以上のエリアを設定するエリア設定ステップと、コンピュータが、各ページにいずれかの前記ページテンプレートを割り当てるページテンプレート割当ステップと、コンピュータが、各前記ページテンプレートの各前記エリアの各セルに別々に設定することが可能な2種類以上の小組テンプレートのうちの何れか1の小組テンプレートを各エリアの各セルに設定する小組テンプレート設定ステップと、コンピュータが、物件データを蓄積する物件データベースから読み出された複数の物件データの各々を各ページに割り当てられた前記ページテンプレートの各前記エリアの各小組テンプレートに割り当てる物件割当ステップと、を備える。 (もっと読む)


【課題】簡便な操作で複数の文書要素を含む文書を構成することができる文書構成装置及び文書構成プログラムを提供する。
【解決手段】予め文書の類型を指定した上で、スキャナで読み取った画像データを文書受付部10が受け付け、文書記憶部12に記憶する。文書受付部10が受け付けた各文書要素は、文書要素解析部16が文書記憶部12から読み出して解析し、各文書要素の種類を判別する。次に、文書構成部20が、予め指定された文書の類型に基づき、文書構成管理部14に格納されたテンプレートに従って各文書要素を配置して文書を構成する。属性抽出部22は、文字情報解析部16aが抽出した文字列から上記文書構成部20が構成した文書の属性を抽出し、文書記憶部12に記憶させる。また構成された文書は、出力部24から出力する。 (もっと読む)


【課題】1つのデータベースパブリッシングソフトウェアで多種類の物件情報掲載誌を扱う場合でも、ページへのページテンプレート及び小組テンプレートの割当てを効率的に行うことができることを可能とするデータベースパブリッシング装置を提供する。
【解決手段】DTPデータ122B(小組レイアウト)を基に小組スタイル情報生成手段103及び小組テンプレート生成手段104Cにより作成した小組テンプレート及びDTPデータ122B(エリアレイアウト)を基にページスタイル情報生成手段201及びページテンプレート生成手段202Cにより作成したページテンプレートを物件データベース121に登録する。小組配置・物件割当手段等は、物件データベース121に登録された物件データ、小組テンプレート及びページテンプレート並びにフィルタを用いて、XML文書及び小組配置・物件割当データを生成する。 (もっと読む)


【課題】 自作した独自の文字輪郭をwebページに使用する場合、最初に一定量の文字セットについてフォントを準備すると、初期コスト・手間が大きくなる。このような障壁なく、手軽に独自の文字輪郭を用いたwebページを作成し、その際に作成した文字輪郭を有効に利用する。
【解決手段】 管理用webページから記事を投稿すると閲覧用webページから該記事が表示される、ブログ(BLOG:weB LOG)のようなwebページ作成システムにおいて、文字輪郭編集webページを設け、投稿時に記事の表示に必要となる文字についてのみを該文字輪郭編集webページにて作成し、閲覧用webページでの該作成した文字輪郭による独自文字輪郭の表示を行う。作成した文字輪郭を蓄積し、以降の記事投稿時に用いる。作成・蓄積した文字輪郭を、ネットワークを介して他の文字を扱うソフトウェア(ワープロ等)でも使えるようにし、また、他者と共有する。 (もっと読む)


【課題】ページの編集等により、生成する必要のあるページのみ生成するページ差分生成装置を提供する。
【解決手段】メモページ情報登録システムは、ページが編集されたか否かを示すページ更新フラグを含むページ情報を記憶し、ページの編集に伴い、ページ更新フラグの値を「再生成対象」を示す値に変更し、ページ更新フラグが「再生成対象」を示す値であるページ情報についてページ生成を行う。これにより、ページ更新フラグの値が「再生成対象」であるページのみ再生成するため、編集されているか否かに関わらず、全ページに対して生成を行う場合に比して、生成処理における処理効率を格段に改善できる。 (もっと読む)


【課題】構造化データの変換規則の正誤を検証することができるようにする。
【解決手段】
情報処理装置が、第1のデータをメモリに記憶し、第1のデータがプログラムおよび変換規則によって正しく第2の形式に変換された場合に出力される第2のデータを想定した検証用データをメモリに記憶し、検証対象となる変換規則を与えてプログラムを実際に実行することにより第1のデータを第2の形式の第2のデータに変換し、変換後の第2のデータを構成する第2の要素の内容と、メモリに記憶されている検証用データを構成する第2の要素とを比較して、不一致の第2の要素を示すデータを生成する。 (もっと読む)


【課題】XSLTコードのカバレッジを適切に計測することのできる情報処理装置の提供を目的とする。
【解決手段】XMLデータにXSLTコードを適用してXSL変換を実行するXSL変換手段を備えた情報処理装置であって、前記XSL変換手段は、XMLデータに対して第一のXSLTコードを適用してXSL変換を実行する過程において、前記第一のXSLTコードに含まれているXSLT要素の中で実行されたXSLT要素に所定の属性を付加し、前記属性が付加された第二のXSLTコードを出力する属性付加手段を有し、前記第二のXSLTコードに対して第三のXSLTコードを適用してXSL変換を実行することにより、前記属性に基づいて前記第一のXSLTコードにおいて実行され得るXSLT要素の数に対して実行されたXSLT要素の数の割合を算出することにより上記課題を解決する。 (もっと読む)


【課題】本発明は、構造の異なる複数のWebページを記述するHTML文書から、ユーザが所望するデータを抽出し、共通のフォーマットに統一する方法を提供すること。
【解決手段】Webページを閲覧可能な端末20と通信回線を介して接続されたサーバ10が、共通のフォーマットを示すXMLスキーマを記憶し、前記Webページに含まれる所定のデータの、ブラウザ上における位置を示す位置データを、端末20から受信し、受信した前記位置データに基づいて、前記Webページを記述するHTMLテキスト内における、前記所定のデータの位置を表現するロケータ文を生成し、生成した前記ロケータ文に基づいて、前記HTMLテキスト内から前記所定のデータを抽出し、抽出した前記所定のデータに関連付けるタグ名を、前記XMLスキーマから選択し、前記タグ名を関連付けた所定のデータを、前記XMLスキーマに基づいて記憶する。 (もっと読む)


141 - 160 / 572