説明

Fターム[5B009QA01]の内容

文書処理装置 (8,318) | 文体校正(推敲) (1,272) | 自然文解析 (461)

Fターム[5B009QA01]の下位に属するFターム

Fターム[5B009QA01]に分類される特許

61 - 78 / 78


【課題】構造化文書を用いてデータ処理装置間で行う文書交換において、文書交換の適合性を評価するための評価データを生成する構造化文書評価データ生成装置を提供する。
【解決手段】構造化文書の構造を形成する要素とその属性を設定する項目と、前記構造化文書の構造に基づかない、スペースや終了タグなどのデータ表現に使用するデータを設定する項目とを評価項目として組合わせることにより評価データを生成する。 (もっと読む)


【課題】 係り受け関係に着目して一群の文の傾向等を把握できるようにする。
【解決手段】 係り受け関係分析装置100は、文書入力部10、形態素解析部11、構文解析部12、構文解析結果データ記憶部13、検索式入力部14、係り受け関係抽出部15、係り受け関係ソート部16、係り受け関係頻度計数部17および係り受け関係表示部18等を含んで構成されている。係り受け関係表示部18は、係り受け関係の係り部分および受け部分を対比させてその頻度、構造、文等を表示する。頻度等でソートを行なうことにより重要な係り受け関係を把握して全体の傾向を把握する。 (もっと読む)


【課題】階層情報を判別するためのシステムおよび方法を提供する。
【解決手段】態様は、非テキスト情報を階層内容に構文解析するためにコリンズモデルを使用することを含んでいる。システムおよび方法は、行が相互にどのように関連するかを示すラベルを行に割り当てる。 (もっと読む)


【課題】 より精度良く、言語解析を行えるようにする。
【解決手段】 単語を潜在クラスに基づく確率分布で表現し、文や文書など複数の単語から構成される言語単位を、それを構成する個々の単語の確率分布表現を重畳することによって表現する。そして、確率分布間の距離尺度を規定することによって、文書検索や用例ベースの言語処理など、言語単位間の類似尺度を利用した自然言語処理を行う。本発明は、言語解析を行い、ユーザとの対話を処理する情報処理装置に適用することができる。 (もっと読む)


【課題】最小の情報量で、階層構造に属する文書群の概要を把握できる重要語提示装置を提供する。
【解決手段】階層的分類構造を持つ複数の文書群を扱う文書管理システムで使用される重要語提示装置は、各分類階層の下位構造に含まれるすべての文書群から複数の重要語候補を抽出して、分類階層ごとに抽出した重要語候補と階層とを対応付けて記憶する重要語候補抽出部と、ある階層の重要語群を抽出する際に、該階層の重要語候補から該階層より上位階層における重要語を削除した、残りの重要語候補を該階層の重要語として記憶する重要語格納部と、ユーザに提示する分類階層の重要語群および該分類階層よりも上位の分類階層の重要語群もあわせて提示する重要語提示部を備えている。 (もっと読む)


【課題】 電子テキストの中から重要文を抽出するときの重要文抽出精度を向上させる。
【解決手段】 訓練用電子テキストに基づき訓練用文ベクトルを作成する訓練用文ベクトル作成プログラム121と、訓練用文ベクトルに基づき重要文事前確率を算出する重要文事前確率算出プログラム122と、テスト電子テキストからテスト文ベクトルを作成するテスト文ベクトル作成プログラム124と、単語生成確率が共役事前分布に従うときに得られるテスト文生成確率を表わす数式に基づきテスト文生成確率を算出するテスト文生成確率算出プログラム125と、重要文事前確率およびテスト文生成確率に基づきテスト電子テキストに含まれる文ごとに重要文になる確率を算出することにより重要文を抽出する重要文抽出プログラム126とを実行することによって重要文を抽出する。 (もっと読む)


【課題】 分類タイプ検出器および/または文脈情報を利用して、注釈ストロークを認識し、アンカーを設定して、リフロー可能なデジタル注釈を与えるシステマティックな手段を提供すること。
【解決手段】 これにより、デジタル文書内の注釈のアーカイブ、共有、検索が行え、また操作も簡単に行える。本発明の一実施例では、注釈認識方法により、グループ化され、分類され、文書内の基本テキストおよび/または点へのアンカーが作成されるストロークの入力が得られる。本発明の他の実施例では、言語学的な内容、領域特有の情報、アンカーの文脈、および文書文脈を利用して、注釈を正しく認識しやすくする。 (もっと読む)


【課題】 所定の自然言語処理に供するための入力文を文字列の貼付を利用して形成させても、上述の自然言語処理の精度を低下させることを防止する。
【解決手段】 本発明においては、電子文書中の文字列を選択させて入力文記憶手段の入力文に貼り付けながら入力文を形成させる。この際、所定の条件が成立したときに、貼り付けられる文字列の先頭及び又は終端に、予め定められた文区切り文字を追加する。例えば、所定の条件とは、貼付けられる文字列と、既に入力されている入力文との連結部分に、意図しない単語が生じるような場合である。 (もっと読む)


【課題】高度な技能や習熟度を必要とせず、特許出願用文書などの特殊文書を誰でも簡単かつ効率的に作成可能とする。
【解決手段】複数の項目を有する特殊文書の作成を支援する文書作成支援装置10において、入力部13を通じて所定の書式に従って各項目に関するテキストを入力すると、制御部11はその入力テキストを元にして、次の項目に関する案文テキストを生成し、当該文書の作成支援情報として表示部14に出力する。これにより、作成支援情報として出力された案文テキストを参考にして、次の項目に関するテキストを入力しながら当該文書を誰でも簡単かつ効率的に作成することができる。 (もっと読む)


【課題】対象コンテンツの評価について、より実態に即した問題点の把握を可能とする評価プログラム等を提供する。
【解決手段】コンピュータに、
一の評価基準に基づいて対象コンテンツを一次評価する機能と、
他の評価基準に基づいて対象コンテンツを一次評価する機能と、
複数の当該一次評価に基づいて対象コンテンツを二次評価する機能と、
を実現させる対象コンテンツの評価プログラム。 (もっと読む)


文書テキストから言語を同定する方法であって、ニューラル・ネットワーク(20)に基づく言語同定システムを利用して、アルファベット文字からなる文字列の言語を複数の言語間で同定する。NN−LID(20)システムが、アルファベット文字からなる標準アルファベットセット(22)を用いて、アルファベット文字からなるマップ済み文字列(10)に上記文字列をマップして、上記標準アルファベットセット(22)に基づいて、上記マップ済み文字列が言語のうちの1つとなる尤度を決定できるようにする。標準アルファベットセットの文字は言語依存型のアルファベット文字セットから選択される。スコアリングシステム(30)も利用して、上記言語依存型セットに基づいて、上記文字列が各言語の文字列となる尤度を決定する。
(もっと読む)


【課題】 議論の内容・流れ、発言が議論に与えた影響を容易に把握できるようにする。
【解決手段】 属性情報付与部16は、入力した発言(対象発言)の属性情報を付与するユーザに対して、属性情報を入力するインタフェースを提供する。ユーザは発言表示領域に表示されている発言を選択することで入力した発言(対象発言)に対する参照発言を入力し、発言種類ボタンを選択することで発言種類を入力する。属性情報絞り込み部20は、属性情報の絞り込みを行い、属性情報付与部16へ絞り込み結果を反映させる。発言格納部12は入力された発言と、付与された属性情報を(発言種類符号と参照発言符号)発言データベース13へ格納する。連結単位作成部17は発言データベース13に蓄積された情報を基に、発言の質疑応答の流れに基づいた、発言の連結単位を作成する。 (もっと読む)


本発明は、注釈付けされた訓練データに基づいて訓練される統計モデルを使用することによって、構造化されていないテキストを構造化するための方法、コンピュータプログラム及びコンピュータシステムに関する。テキストがセグメント化される各テキストセクションは、更に、ラベルの組に関連するトピックに割り当てられる。テキストのセグメンテーション及びテキストセクションに対するトピック及びその関連するラベルの割り当てのための統計モデルは、テキストセクションとトピックとの間の相関関係、セクション間のトピック遷移、文書内のトピック位置、及び(トピック依存の)セクション長、を明示的に説明する。それゆえ、訓練データの構造的な情報が、未知のテキストのセグメンテーション及び注釈付けを実施するために利用される。
(もっと読む)


本発明は、注釈付けされたトレーニングデータに基づいてトレーニングされた統計モデルを利用することによって非構造化テキストを構造化するための方法、コンピュータプログラムプロダクト、セグメント分割システムおよびユーザーインターフェースに関する。実行されるセグメント分割および付与は全体的な校閲のためにユーザーに提示される。追加的に、代替的なセグメント分割およびラベル付与がユーザーに提示される。ユーザーは代替セグメント分割および代替ラベルを選択することも、ユーザー定義のセグメント分割およびユーザー定義のラベルを入力することもできる。ユーザーによって導入された修正に反応して、複数の異なる動作が開始されるが、それには当該文書の後続部分または当該文書全体の再セグメント分割および再ラベル付けが含まれる。さらに当該方法は、当該方法をユーザーの嗜好に適応させるため、および前記統計モデルをさらにトレーニングするため、ユーザーが導入した修正の学習機能、ログ記録、解析を有する。
(もっと読む)


【課題】ユーザが医療手順のような手順に関する報告書を作成することを支援するための方法及びシステムを提供する。
【解決手段】第1のディスプレイ領域は知識ベースから有効なキーワードの階層メニューを提供する。第2のディスプレイ領域はユーザにより選択された特定のキーワードの階層メニューを提供する。第3のディスプレイ領域は選択されたキーワードに基づいて文章モデルをポピュレートすることによって生成された文章から報告書を提供する。文章はその文章からキーワードを選択し、その後第1のディスプレイ領域から置換キーワードを選択することによって編集されることができる。文法エンジンはキーワードのユーザ設定に基づいて文章の文法を補正する。 (もっと読む)


【課題】クレーム文を図式化表示し、クレーム文の中の技術要素を抽出し、技術要素どうしの関係を図式化表示の中で明確に表示し、クレーム文として再検討すべきことを出力する特許明細書デバッグツール。
【解決手段】入力した日本語のクレーム文をクレーム文解析用の形態素辞書を用い形態素解析して、格助詞「と」に前置される技術要素と「前記」などの指示語に後置される語句から特定される技術要素とを抽出し、発明を特定する要素である主題とその主題に直接関係する技術要素との木構造を作成し、技術要素どうしの関係を木構造の上で図式化表示して技術要素どうしの関係を明確に理解できるようにし、クレーム文の中の技術要素の上位概念の語句を検出出力し、上位概念語句の使い方と、文法上の問題点と、技術要素の使い方での問題点を出力して、クレーム文の再検討を容易にできるようにする。。 (もっと読む)


【課題】クレーム文を図式化表示し、クレーム文の中の技術要素を抽出し、技術要素どうしの関係を図式化表示の中で明確に表示し、クレーム文として再検討すべきことを出力する特許明細書デバッグツール。
【解決手段】入力した日本語のクレーム文を形態素解析して、クレーム文を前提部と特徴部とに分離し、クレーム文の中から主題と主題に関する技術要素と、それらを説明する部分とを抽出して木構造を作り、クレーム文の中から抽出した技術要素どうしの関係を木構造の上で図式化表示して、技術要素どうしの関係を明確に理解できるようにし、クレーム文の中の技術要素の上位概念の語句を検出出力し、上位概念語句の使い方と、文法上の問題点と、技術要素の使い方で問題のあることとを出力して、クレーム文の再検討を容易にできるようにする。 (もっと読む)


【課題】 研究者が作成した学術論文に基づいて自動的に特許明細書を作成することが可能な特許明細書作成システムを提供することを課題とする。
【解決手段】 特許明細書作成システム1は、学術論文5を記憶する論文記憶部4と、論文記憶部4に記憶された学術論文5から特許明細書の「発明の名称」、「特許請求の範囲」、「課題を解決するための手段」、「発明の属する技術分野」、「従来の技術及び発明が解決しようとする課題」、「発明の実施の形態」、「発明の効果」、「図面の簡単な説明」の各欄を作成する作成プログラム6a,6b,6c,6d,6e,6f,6gとを有することにより、上記課題を解決することができる。 (もっと読む)


61 - 78 / 78