説明

Fターム[5B009QA01]の内容

文書処理装置 (8,318) | 文体校正(推敲) (1,272) | 自然文解析 (461)

Fターム[5B009QA01]の下位に属するFターム

Fターム[5B009QA01]に分類される特許

41 - 60 / 78


【課題】事故が発生する前にリスクの大きさを認識出来、刻々と変化する社会情勢にも即時に追従出来る危険予知管理システムを提供する。
【解決手段】提案・報告・報道のテキスト文章情報を文章要素分解部8によりテキスト語彙情報に分解し、そのテキスト語彙情報について、危険評価辞書DB9に記憶された危険点数を割り当てて分解前のテキスト文章情報の総合危険点数をその総合危険点数とし、そのテキスト文章情報を類似危険事項カテゴリ分類部12により類似する危険事項のカテゴリ群に分類し、そのカテゴリ群においてテキスト文章情報の危険点数のうち最大のものをそのカテゴリ群の代表総合危険点数とし、新たに入力され記憶されたテキスト文章情報の総合危険点数がそのカテゴリ群の代表総合危険点数よりも大きい場合に、その代表総合危険点数を新たに入力され記憶されたテキスト文章情報の総合危険点数に変更する総合危険点数変更部13を有して構成する。 (もっと読む)


【課題】文書データの内容の整合性の良し悪しを容易に判別する。
【解決手段】文書データ処理装置1の制御部2は入力文書データ中の各記述情報と関わる分類項目名を記憶部4に記憶されるテキストマイニング辞書を用いて検索する。そして、ユーザの意図する分類項目名が入力部3により入力されると、制御部2は記憶部4に記憶されるテキストマイニング辞書上で関連付けられる各分類項目名のうち前述したように検索した分類項目と異なる分類項目名と関連付けられる各記述情報を非該当表現として検索し、これをモニタ表示する。 (もっと読む)


【課題】文章の各文を提示する際の文の提示順を変更する。
【解決手段】文章の文を対話形式で提示する提示装置において、入力装置から操作コマンドが入力されると、これが次のドキュメントを指示するコマンドが格納されているか否かを判断する(154)。次のドキュメントを指示するコマンドの場合、次のドキュメントに移行するための処理を実行する(164)。次のドキュメントを指示するコマンド以外の他の操作命令のコマンドの場合、今回のコマンドに対応するテキストを検索し、提示できるように処理する(156)。 (もっと読む)


【課題】複数の電子文書の承認に関して、誤り無く効率的に承認できる技術を提供する。
【解決手段】文書データベースから文書を読み出す文書読込手段と、文書データからキー情報および少なくとも1つの評価項目データを取り出す抽出手段と、キー情報を元に参照データベースから評価項目評価値および評価方法の組を少なくとも1組を取り出す読込手段と、前記評価項目データと前記評価項目評価値から前記評価方法に従って評価項目の数だけ順次評価を行う評価手段と、評価手段の結果に基づき前記文書の承認を行う承認手段と、承認された文書を保存する保存手段と、を有した電子文書承認システムである。 (もっと読む)


【課題】テキスト中の省略日付表現を年月日情報として利用する技術を提供する。
【解決手段】テキストから日付表現を抽出し、テキストの生成日を示す基準日情報、推定する年月日の範囲情報、日付表現が含まれる文脈の時制情報、日付と曜日の組の情報を用いて省略表現から年月日情報を推定する。 (もっと読む)


【課題】 入力したテキストに誤りが含まれている場合であっても、精度良くテキストマイニングを行なう。
【解決手段】 曖昧性のある箇所が1つ以上含まれているテキストに対して、曖昧な箇所を可能な候補に展開して、展開されたテキストから特徴情報を抽出する候補展開特徴情報抽出部40と、抽出した特徴情報を、関連語のグループ毎にまず分類して、その後に特徴情報の度合いを示す統計量が最大となるよう、テキストの曖昧な箇所の候補の組み合わせを選択する特徴情報修正部50とを備えた。 (もっと読む)


【課題】特許出願の文書に関する出願文書情報を作成する出願文書作成装置を提供する。
【解決手段】1以上の発明に関する情報であり、発明を特定する情報である1以上の発明特定情報を有する情報である発明情報が記憶される発明情報記憶部11と、発明情報に含まれる発明特定情報に関する説明を示す情報である説明情報が記憶される説明情報記憶部12と、発明情報、及び説明情報に基づいて、特許出願の文書に関する情報であり、発明情報に関する1以上の実施の形態を含む情報である出願文書情報を作成する作成部15と、作成部15が作成した出願文書情報を出力する出力部16と、を備える。 (もっと読む)


【課題】 利用者にデジタル文章コンテンツ試読用のサンプルコンテンツを利用者に提示する際に、書籍に特有である文章のフォーマット等を考慮した試読用のサンプルコンテンツを、容易に利用者に提示する一方、利用者の文章コンテンツ購入前には、購入させるべきコンテンツ全貌は推量不能を維持する。
【解決手段】 文章デジタルコンテンツを文章構成上の区切りに基づいて複数のセグメントに分割する文章コンテンツ分割部(103)と、セグメントから所定の文字種別に属する文字のみを出現順に抽出し、該文字のそれぞれを1ブロックとしてブロック番号を付与する文字抽出部(1031)と、抽出されたブロックを、ブロック番号に基づきランダムに順序入れ替えするブロック入替部(1032)と、セグメント内で、順序入替えされたブロック配列に従って、セグメント内の所定の文字種別に属する文字を置換する文字置換部(1033)とを具備する。 (もっと読む)


【課題】 複数の文書データを記録する場合に、効率よく記録できる文書管理システムを提供する。
【解決手段】 差分情報生成部22が2つの文書データの差分情報を生成し、代表文書選択部23が複数の文書データの中から代表文書候補データを選択し、代表文書候補データを除いた代表文書候補外データのそれぞれについて、代表文書候補データとの間の差分情報のデータ量を表す値が最も少なくなるような代表文書候補データを、代表文書候補外データに対応づけ、各代表文書候補データのデータ量を表す値と、各代表文書候補外データに対応する差分情報のデータ量を表す値と、の合計値が最も少なくなるような代表文書候補データのグループを、代表文書グループとして決定し、文書データ記録部24が代表文書データの情報と、代表文書外データのそれぞれに対応する差分情報と、を記録する文書管理システムである。 (もっと読む)


【課題】文書の所定の言語に対する信頼度を演算することができるようにする。
【解決手段】 入力部33は、インターネット11を介して文書を入力する。データベース作成部34は、入力された文書の著者の所属が英語圏かを判断し、英語圏である場合には高信頼タグを付与して、高信頼文書71として英文データベース格納部37に格納する。著者の所属が英語圏でない場合には、非高信頼タグを付与して、非高信頼文書72として英文データベース格納部37に格納する。推論部41は、英文データベース格納部37に格納されている文書からフレーズを抽出し、そのフレーズが高信頼文書71とヒットした数、並びに非高信頼文書72とヒットした数に基づいて、英文品質値を演算し、それに基づいて高信頼文書71と非高信頼文書72としての文書の構成を再構成する。 (もっと読む)


【課題】 数値限定を伴う発明についての特許出願用書類をより効率的に作成する文章作成支援システムを提供する。
【解決手段】 複数の数値限定項目のそれぞれについて、その数値限定項目の数値範囲における境界値の技術的意義に関する文章情報を、発明が利用される目的に対応付けて記憶する文章情報記憶手段4と、文章情報記憶手段4に記憶されている文章情報から、限定項目取得手段5によって取得された数値限定項目についての文章情報であって、目的・分野取得手段5によって取得された技術分野または利用目的に対応付けられた文章情報を特定する文章情報特定手段5と、特定された文章情報中における所定の箇所に、前記取得された数値限定項目の前記数値範囲に応じた数値を設定する数値設定手段5と、その数値が設定された文章情報を特許出願用書類に記載すべき文章として合成する文章合成手段5とを有する。 (もっと読む)


【課題】 文書に対して手書きで追記された追記マークに基づいて、互いに関連性を有すると推測される領域の記載内容を集めてユーザに判りやすく提示する。
【解決手段】 紙文書を電子化して得られる文書画像データを解析し、その文書画像データの表す文書の原本に対して手書きで追記された追記マークを抽出する抽出手段と、抽出された追記マークの各々について、その追記マークが対応付けられている画像領域を特定する特定手段と、複数の追記マークが抽出された場合に、各追記マークの形状を解析して、同一又は類似する形状を有する追記マーク毎に分類する分類手段と、同一又は類似する形状を有すると分類された追記マークの各々について、その追記マークに対応付けられていると特定された画像領域に配置されている画像を所定のレイアウトにしたがって出力する出力手段とを有する文書処理装置を提供する。 (もっと読む)


【課題】日本語文書等における誤りを指摘する文書校正装置およびプログラム記憶媒体に関し,文書中の誤り箇所の過剰指摘を防止し,ユーザの判断を軽減させて,校正作業効率を向上させることを目的とする。
【解決手段】複数の誤り確率計算部2a,2b,…は,それぞれ異なる誤り確率計算手法により誤り確率値を計算する。誤り確率保存部3はこれらの誤り確率値を集計し,原テキストの各文字または文字列に対して,集計した誤り確率値を付与する。誤り候補抽出部5は所定の誤り確率閾値4を超える誤り確率値を持つ文字または文字列を誤り候補として抽出する。誤り表示処理部6は,抽出された誤り候補を校正用のテキスト中に下線付き表示または色違い表示等により表示する。 (もっと読む)


【課題】 画像データに関連付けられた気象情報が文章で表現されたコメントを生成する。
【解決手段】コメント生成装置は、コメントが生成される対象となる対象画像データを選択する画像データ選択部と、対象画像データが生成された生成日時を示す日時情報を取得する日時情報取得部と、対象画像データが生成された生成位置を示す位置情報を取得する位置情報取得部と、対象画像データの生成位置および生成日時を含む所定の地理的および時間的範囲における気象状態を示す気象パラメータを取得する気象パラメータ取得部と、取得された気象パラメータを用いて、気象状態が文章によって表現された気象コメントを生成するコメント生成部と、を備える。 (もっと読む)


【課題】 連絡文書がユーザによって熟読されているか否かを評価することが可能な熟読度評価装置及び熟読度評価方法を提供する。
【解決手段】 連絡文書送信端末10aが連絡文書受信端末10bに連絡文書を送信する通信システムで用いられるサーバ20が、連絡文書受信端末10bの表示部12上に表示される連絡文書に向けられた視線の位置を示す視線情報を受信する受信部21と、受信部21によって受信された視線情報に基づいて、視線が往復した回数である視線往復回数を含む視線軌跡情報を生成する視線軌跡情報生成部23と、視線軌跡情報生成部23によって生成された視線軌跡情報に基づいて、連絡文書の熟読度を算出する熟読度算出部24とを備える。 (もっと読む)


【課題】 会議参加者に負担をかけることなく、議事録作成者の意図を加味した議事録を作成できる議事録作成支援装置する。
【解決手段】 議事録作成支援装置1は、入力された会議の進行内容を受け付けると共に、この会議の進行内容を会議映像に関連付けるメモ編集部2と、会議の進行内容及び会議中の音声に基づいて、会議の進行内容の会議映像への関連付けを保持した状態で議事録を作成する議事録作成部3と、会議映像を保持する会議映像保持部4と、議事録作成部3が作成した議事録を閲覧するための議事録表示部5とを有する。また、議事録作成部3は、会議中の音声を音声認識することによって書き起こしテキストを作成して議事録を作成する。会議の進行内容の会議映像への関連付け保持した状態で議事録を作成するため、議事録の記述内容と会議映像との間にリンクをはることができ、記述内容が会議のどのシーンに対応するのかを後で確認することができる。 (もっと読む)


【課題】効率のよい言語識別を提供すること。
【解決手段】自然言語テキストの言語識別のシステムおよび方法が提示される。このシステムは、自然言語に見られる文字のリストについての格納された期待される文字カウントおよび分散を含む。期待される文字カウントおよび分散は、言語識別時に考察される複数の言語について格納される。実行時に、実際の文字カウントと期待される文字カウントとの比較に基づいて、テキストサンプルの1つまたは複数の言語が識別される。本発明の方法は、考察される言語の数を制限するために、テキストサンプル中の文字のUnicode範囲の上流分析と組み合わされ得る。さらに、本発明のシステムおよび方法によって識別された言語の中から蓋然性の最も高い言語を選択するために、下流処理において、Nグラム法も使用され得る。 (もっと読む)


【課題】括弧類が入れ子構造を持っていないこと等により、その対応関係が必ずしも明確ではない情報についても括弧類の階層構造を適切に判断する機能を提供する。
【解決手段】本発明は前括弧類、後括弧類を検索する検索手段を有する情報処理装置において、前括弧類と後括弧類が一対の組を構成するかどうかを判別する判別手段を提供する。また、上記判別手段により判別された一対の組を構成する前括弧類と後括弧類についての情報を、情報出力手段に出力することにより、この後に別の情報処理装置による処理の参考情報を付加することが可能となる。さらに、上記判別手段により判別された一対の組を構成する前括弧類と後括弧類で囲まれる領域について、それらの領域を画面に表示する際に領域毎に色を変化させることも可能となる。また、上記判別手段により判別された一対の組を構成する前括弧類と後括弧類だけを、それぞれ別の色に変えて表示することも可能となる。 (もっと読む)


【課題】 画像を含む文書情報の可読性を向上する。
【解決手段】 文書情報表示装置100は以下の処理を行う。画像単位抽出部120は文書データから画像および画像の説明を画像単位として抽出する。そして抽出した画像単位を文書データ内で一意の文書データと関連付けて画像単位記憶部192に記憶し、画像を画像単位記憶部192に記憶された画像単位と関連付けて画像記憶部193に記憶する。また文書データにおいて画像単位部分を画像単位と関連付けた文書データに置換して画像置換データ記憶部194に記憶する。文書解析部130は画像置換データ記憶部194に記憶された文書データを入力して任意の文書解析を行い、解析結果を解析データ記憶部195に記憶する。出力部140は解析結果を取得し、解析結果に関連する画像単位および画像を画像単位記憶部192および画像記憶部193から取得して解析した文書を表示する。 (もっと読む)


【課題】首尾よくデータ共有及び管理を行うように半構造化ないし未構造化フォーマットで収集されたどのデータでも完全に利用するように、セマンティクスでデータを注釈する。
【解決手段】コンピュータ実行方法は、コンセプトを入力データとしての電子データにマッピングする一群の注釈要素を規定し;決定された一群の注釈要素及び入力データのサンプルに従ってマッピングルールを生成し;マッピングルールを入力データに適用することで入力データにコンセプトをマッピングし;及びコンセプトの入力データへのマッピングに基づいて入力データのセマンティックインスタンスを生成する。前記一群の注釈要素が、入力データに対応する選択されたオントロジ、オントロジコンセプト、サンプル入力データ中のワードと選択されたオントロジ中の選択されたオントロジコンセプトとの対応関係、及びサンプル入力データ構造に関するマッピングされたワードのパターンである。 (もっと読む)


41 - 60 / 78