説明

Fターム[5B009QA02]の内容

文書処理装置 (8,318) | 文体校正(推敲) (1,272) | 自然文解析 (461) | 文法解析によるもの (192)

Fターム[5B009QA02]の下位に属するFターム

Fターム[5B009QA02]に分類される特許

1 - 20 / 46


【課題】入力文の記号論理式レベルの文への単純化、記号論理式レベルの単純な文を用いた推論、及び記号論理式レベルの文に基づく出力文の生成の統一的、単純な方法による実現、並びに同様な方法による論理又は言語表現の自動的学習の実現。
【解決手段】従来記号論理式によって行われている推論処理を、記号論理式と同レベルの単純さの自然言語文を用いて行い、それにより入力文から出力文への変換処理を統一する。また、入力文から記号論理式レベルの文への言い換えを逆用して、出力文生成を実現する。さらに、同様の言い換えを利用して、単純化された論理又は言語表現を抽出する。 (もっと読む)


【課題】関連する文書データを特定する際の操作負担を軽減させる。
【解決手段】文書処理装置は、テキスト情報を抽出するテキスト文書抽出部と、テキスト情報に含まれている文字列の係り受け関係を解析する構文解析部と、係り受け関係の内容を示すタグを、当該係り受け関係が示す文字列に割り当て、テキスト情報に埋め込む論理構造埋込部と、タグが割り当てられた文字列に文書名が含まれている場合、文書名を識別するタグを、テキスト情報に対して埋め込む文書タグ埋込部と、文字列の入力を受け付けるユーザ入力受付部と、テキスト情報に埋め込まれたタグに基づいて、入力を受け付けた文字列と係り受け関係を有する文書名を含む文字列が存在するか否か判断する判断部と、文書名が存在すると判断された場合、文書名で示されたXML文書又は文書データを検索する検索部とを備える。 (もっと読む)


【課題】学習データを必要とせずにテキストセグメンテーションが可能なWeb検索を利用したテキストセグメンテーションを実現する。
【解決手段】本発明は、入力されたテキストを文単位に分割し、分割された文を形態素解析し、形態素解析された名詞、副詞、動詞、形容詞、形容動詞を検索語として抽出し、検索語に基づいてウェブ検索したテキストを形態素解析し、解析された形態素のうちで、名詞、副詞、動詞、形容詞、形容動詞を関連語として取得し、検索語と関連語との組み合わせであるキーワード集合を用いて、入力テキストを分割した複数の文同士の連結性を判定し、該連結性の谷と谷の間にある文同士である意味段落を抽出することによって入力テキストを分割する。 (もっと読む)


【課題】指定された単語の意味を表示させるときに、文書の内容に適した単語の読みや意味を通知することのできる電子辞書システムを提供する。
【解決手段】コンピュータ10に備えられた推奨意味データ抽出手段106は、指定された単語の解説データに含まれる意味データの中から、選択された単語の品詞や、選択された単語の前後関係から、一つの意味データを推奨意味データとして抽出し、コンピュータ10に備えられた表示制御手段104は、他の意味データと推奨意味データを視覚的に区別して表示する表示データを生成する。 (もっと読む)


【課題】適切にパラフレーズされた文を取得する。
【解決手段】構文解析部4は、入力文の構文木を生成する。文節特定部5は、検索対象文と入力文との間で一致する自立語を含む文節を特定する。文節特定部5は、一致する自立語を含む文節を特定した場合に、一致した自立語を含む入力文の文節を示す文節IDを、一致文節IDとして検索対象文記憶部11の検索対象文管理テーブルに格納する。言い換え対象文決定部10は、入力文の構成と検索対象文の構成を比較し、一方の文を基準文とし、他方の文を言い換え対象文と決定する。判断部6及び置換部7は、言い換え対象文に含まれる部分構文木の置換処理を行なう。類似度判定部8は、置換された言い換え対象文と入力文との間で類似度を判定する。表示処理部9は、類似度判定部8による判定結果に基づいて、検索対象文の出力処理を行なう。 (もっと読む)


【課題】文書を時系列に沿って出力する際に、その文書の内容をよりよく理解できるようにする情報処理装置を提供する。
【解決手段】文書が記憶される文書記憶部11、文書から用語を抽出する用語抽出部12、文書をチャンクに分割し、各チャンクの係り受けを示す係り受け情報を取得する係り受け情報取得部13、係り受け情報を用い、文書から、一のチャンクに係る複数のチャンクの位置を入れ替えた文書を生成する文書生成部14、用語と画像を対応付ける対応情報が2以上記憶される対応情報記憶部16、抽出された用語に対応する画像を取得する画像取得部17、抽出された用語が均等に出現する文書を選択する文書選択部15、選択された文書のテキストを時系列に沿って出力する文書出力部18、取得された画像を、対応する用語が出力されるタイミングで表示する画像表示部19を備える。 (もっと読む)


【課題】用語辞書作成者の負荷を増大させることなく、用語辞書を作成すること。
【解決手段】文書に記載された文章中に含まれる用語の辞書を生成する用語辞書生成方法であって、文書に含まれるテキスト情報から名詞句を抽出するステップ502と、前記抽出した名詞句が、辞書データベースに格納済みか否かを判断するステップ504と、前記抽出した名詞句が前述辞書データベースに格納済みの名詞句の場合に、前記抽出した名詞句の出現頻度に1を加算するステップ506と、前記抽出した名詞句が前記辞書データベースに格納されていない未知の名詞句である場合に、前記未知の名詞句を抽出元の文書の属性情報とともに前記辞書データベースに格納するステップ505と、前記辞書データベースに格納済みの名詞句と関連する他文書の属性情報を前記辞書データベースに格納するステップ507と有する。 (もっと読む)


【課題】ユーザが用いる省略語の認識率が高い音声認識辞書生成装置を提供する。
【解決手段】ユーザが作成した文章を入力する入力部31と、入力された文章を単語に分割し、当該分割された各単語と辞書に登録された単語とを比較する構文解析部32と、構文解析部による比較に基づいて省略語を抽出する既知省略語判定部33及び省略語推定部34と、抽出された省略語の正式単語を特定する省略語判定部35と、抽出された省略語と特定された正式単語とを関連付けて辞書に登録する登録部37とを備える。 (もっと読む)


【課題】文章として正しくない構文や読み言葉として変換不可能な記号が含まれるテキスト情報でも、当該テキスト情報の意味を正しく理解可能とする読み言葉変換システムを提供する。
【解決手段】読み上げ対象のテキスト情報を構文解析装置17で解析し、文章として正しくない構文または変換不可能な記号を含むテキスト情報であった際、検索装置18にて、当該テキスト情報のキーワードを検索語として抽出して、通信装置11a、情報センタ20を介してインターネット30上のコンテンツを検索し、検索結果としてダウンロードされた前記キーワードを含むテキスト情報の中から、構文解析装置17の解析結果として、文章として正しい構文で、かつ、変換不可能な記号を含まないテキスト情報を抽出し、抽出したテキスト情報を、読み上げ対象の元のテキスト情報と入れ替えて、テキスト読み上げ装置15により読み言葉として読み上げて、スピーカ16aから出力する。 (もっと読む)


【課題】電子メール内に複数のスケジュール情報が記載されている場合に、スケジュール管理システムに登録することができるスケジュール登録支援システム、スケジュール登録支援方法及びプログラムを提供する。
【解決手段】入力された電子メールから解析対象部分を抽出し、解析対象部分に対して形態素解析及び構文解析を行い、それら解析結果に対して、一般名詞、固有名詞、未知語、日付表現の語句のみをスケジュール情報として取得し、取得したスケジュール情報を、タイトル、時間、場所の各項目に分類し、分類したスケジュール情報について出現回数及び出現文書数を計算し、その結果を分類知識情報として分類知識DBに格納した後、再度分類知識情報を取得し、分類したスケジュール情報に対して分類知識情報に基づいて順位付けを行い、順位付けに基づいてスケジュール候補リストを作成し、スケジュール管理システムに登録する。 (もっと読む)


【課題】 匿名化する単語の辞書を用意する必要が無く、かつ、単語及びその単語を含む周辺表記の組合せが稀な場合でも適切に匿名化可能な技術を提供する。
【解決手段】 文字列を含む文章データの各々を分類条件に従って複数種に分類し、該分類により同一種に分類された文章データ(以下、名寄せデータ)の各々に含まれる単語を複数抽出し、該抽出した単語の各々のうち1つ以上を含む単語組合せの各々のうち、該単語組合せを構成する単語の全てが含まれている名寄せデータの数が閾値以上であるものを抽出し、文章データの各々に含まれる文字列に含まれる単語のうち、抽出した単語のうち少なくとも一部と一致し、かつ、抽出した単語組合せを構成する単語と一致しないものを匿名化する。 (もっと読む)


【課題】文章全体として妥当性の高い分割結果を得ることを課題とする。
【解決手段】文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、構造との関係で定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成し、定型文章に適した構造が利用者によって小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、生成した小節列と記憶部に記憶されている構造パターンとを照合し、小節列と一致すると照合された構造パターンを定型文章の分割結果として選択する。 (もっと読む)


【課題】学習データを必要としないテキストセグメンテーション方法、その装置、プログラム、および記憶媒体を提供することを目的とする。
【解決手段】入力したテキストを、文単位に分解するテキスト分解部と、上記テキスト分解部が分解した文を形態素解析し、解析された形態素のうちで、名詞を検索語として抽出する検索語抽出部と、上記検索語抽出部が抽出した検索語によってウェブ検索し、検索されたテキストを形態素解析し、この解析された形態素のうちで、名詞を関連語として取得する関連語取得部と、上記検索語と上記関連語との組み合わせであるキーワード集合を用いて、上記入力したテキストを分解した複数の上記文同士の連結性を判定し、連結性が所定の閾値よりも高い文同士である意味段落を抽出することによって、上記入力したテキストを分割する連結性判定部とを有することを特徴とするテキストセグメンテーション装置である。 (もっと読む)


【課題】小規模であり限定的な情報のみで文書データを解析することで現実的な文書理解支援を行うことができる文書理解支援装置、文書理解支援方法、及びコンピュータプログラムを提供する。
【解決手段】文書の論理構造に関する情報、文書の修辞構造に関する情報、カテゴリ情報と対応付けた、特定の観点から語句群を抽出する条件に関する情報、及び複数のカテゴリ情報間の対応関係に関する対応情報を記憶してあり、受け付けた文書データに含まれる記載内容に関する情報に基づいて、論理構造に関する情報及び修辞構造に関する情報を抽出し、抽出された論理構造に関する情報及び修辞構造に関する情報に基づいて、条件に関する情報ごとに語句群を抽出し、抽出された語句群及び記憶してある対応情報に基づいて、語句群に含まれる語句の組み合わせ及び順序を特定し、特定された語句の組み合わせ及び順序に関する情報を出力する。 (もっと読む)


【課題】 法令又は例規について作成された条文の用字用語審査において、他の法令や例規を引用することによって生じる課題に対応することが可能な用字用語審査装置等を提供する。
【解決手段】 ユーザ端末からユーザが作成した例規の条文を受信すると、形態素解析辞書と対照させて、条文を形態素に分解した分ち書き文を作成する。分ち書き文を構成する各々の単語について、用字用語辞書と対照させて、誤り表記に該当するものについて警告メッセージを作成する。ここで、法令名や例規名を品詞分解可能な語であっても一の形態素として形態素解析辞書に登録することによって、これらがさらに形態素に分解され、その一部が誤り表記と判定されてしまうことを回避することを可能にする。形態素解析辞書に登録される法令名と例規名は、最新の情報が記憶された法令データベース等との差分が自動更新される。 (もっと読む)


【課題】複合語に着目して、関連語句を抽出して文書データ解析を支援する。
【解決手段】一群の文のデータが文書入力部10により入力される。形態素解析部11は、1つの文のデータを処理対象として取り出し、形態素解析を行い、構文解析部12は形態素解析結果に基づいて構文解析を行なう。構文解析結果は構文解析結果データ記憶部13に登録され、すべての文について以上の処理を繰り返す。こののち、名詞部抽出部14が名詞の形態素および名詞の複合語を所定の抽出規則で抽出し、名詞部抽出結果データ記憶部16に登録する。形態素のみに着目した検索、形態素および複合語の双方を対象とした検索を行ない、多様な観点から語句の検索が行う。 (もっと読む)


【課題】ブログ等の個人情報群から仮想的なチャットなどに利用するコーパスを生成できなかった。
【解決手段】評価対象の評価を示す評価語を含む評価情報を格納し得る評価情報格納部と、評価される対象を示す用語である評価対象と、当該評価対象を評価する文を有する評価対象情報を格納し得る評価対象情報格納部と、入力された1種類以上の文章群を格納されている文章群格納部と、文章群格納部に格納されている文章群から評価語と、当該評価語により評価されている対象を示す用語である評価対象を取得する評価対象取得部と、評価対象取得部が取得した評価語と、評価対象を含む文を、文章群から取得する文取得部と、文取得部が取得した文、および評価対象取得部が取得した評価対象を有する評価対象情報を、評価対象情報格納部に蓄積する評価文蓄積部を具備する評判コーパス生成装置により、コーパスを生成できる。 (もっと読む)


【課題】音声情報等でユーザが指定した単語を強調表示し、ユーザが指定した単語が容易にわかるようにすること。
【解決手段】強調表示する単語を格納する格納部9と、マイク1からの音声を認識する音声認識部3と、該認識した音声から単語を認識する単語認識部7と、前記マイク1からの音声の単語から前記格納部9の単語を検索し、該検索した単語を強調表示する強調表示部8とを備える。 (もっと読む)


【課題】長さの制御が文単位より細かくでき、リード文を用いてリード文より多くの情報を含む自然な要約文を生成できる要約文生成装置を提供する。
【解決手段】要約文生成装置1は、リード文と複数の他の文とを形態素解析する形態素解析部11aと、この解析結果に基づいて各々の他の文のリード文に対する類似度を算出する文類似度算出手段12と、この類似度が閾値以上となる他の文を選定する編集文選定部13aと、選定された他の文に含まれる他文文字列と、リード文に含まれるリード文字列とで一致するものを対応させ、対応付けられた当該他文文字列の前もしくは後ろの文字列を、リード文において、対応付けられた当該リード文字列に対して、他文文字列に対する位置と同じ位置に挿入、あるいは、当該リード文字列の同じ位置の文字列と置換するリード文編集手段14とを備えることを特徴とする。 (もっと読む)


【課題】文字列に階調がつけられたときに、文字列を読みやすくする。
【解決手段】CPU102は、文字列の形態素解析を行い文字列を品詞毎に分割する。また、CPU102は、分割により得られた単語の種別が自立語であるか付属語であるか特定する。次に、まずCPU102は各単語に同じ階調数を割り当てる。そして、自立語に割り当てた階調数の半分を自立語に割り当てた階調数から減算する。また、CPU102は、各自立語から減算した階調数を加算し、加算結果を付属語の数で除算する。そして、除算により得られた商を各付属語に割り当てた階調数に加算する。この後、CPU102は、各単語に割り当てられた階調数の階調を有するように、各単語を着色して表示部107に表示させる。 (もっと読む)


1 - 20 / 46