説明

Fターム[5B091AB00]の内容

機械翻訳 (6,566) | 処理対象要素 (373)

Fターム[5B091AB00]の下位に属するFターム

Fターム[5B091AB00]に分類される特許

21 - 23 / 23


【課題】辞書データベースにリストされていない1つまたは複数の語を認識する方法を提供すること。
【解決手段】有効な語が得られない場合、統計的プロセスで、その語の中の2つ以上のキャラクタからなる部分集合である系列を1つまたは複数検査して、その語が有効な語である確率を決定する。代替実施形態では、本発明は、接頭辞除去プロセス、接尾辞除去プロセス、語根プロセス、または結合プロセスあるいはこれらの組合せを含む。接頭辞除去プロセスでは、語から1つまたは複数の接頭辞を除去し、その際に、それらの接頭辞は、好ましくは、接頭辞リストにある。接頭辞除去は、好ましくは、1つまたは複数の接頭辞除去規則によって制約されている。接頭辞除去プロセスは、また、除去した接頭辞についての接頭辞情報を(たとえば、辞書データベースまたは接頭辞リストから)獲得する。接尾辞除去プロセスでは、語から1つまたは複数の接尾辞を除去し、その際に、それらの接尾辞は、好ましくは、接尾辞リストにある。好ましくは、接尾辞除去は、1つまたは複数の接尾辞除去規則によって制約されている。接尾辞除去プロセスは、また、除去した接尾辞についての接尾辞情報を(たとえば、辞書データベースまたは接尾辞リストから)獲得する。語根プロセスでは、辞書データベースから、語根語についての語根情報を獲得する(語根語とは、接頭辞および接尾辞を除去した語である)。次いで、結合プロセスで、接頭辞、語根、接尾辞が、1つまたは複数の結合規則によって定義される、有効な語として組み合わせられるかどうか判定する。次いで、結合プロセスで、有効な語がある場合、その有効な語の1つまたは複数の可能な品詞を獲得し、その有効な語とともに品詞を辞書データベース(または他の記憶場所)に格納する。
(もっと読む)


【課題】 時刻情報を持った語句を解析し、何ら文法的な知識を必要とせずに話題を表す語や速報性の高い重要な語を抽出するための評価を行なう。
【解決手段】 本発明は、外部の情報源から取得した多数の語句について、現在時刻における話題性の強度を算出した評価値を、該語句の基準話題度として算出し、語句及び語句の基準話題度から、該語句の過去の出現状況から話題周期性を検出し、該話題周期より短い期間だけ現在時刻より遡った時刻における該語句の話題の強度に基づいて、話題検出感度を算出し、語句の基準話題度と話題検出感度から、該語句の予測話題度を算出して記録装置に出力する。 (もっと読む)


【課題】 知的労働者が記述したテキストをプラクティスを構成する活動毎に分類して、知的労働者の活動の実態を把握する。
【解決手段】 知的労働者が記述したテキストなどの自然言語文に対し構文意味解析処理を適用し、動詞と格関係、及び動詞の様相や態などの構文意味解析結果を得る。そして、プラクティスの各分類を表現する属性値をこの構文意味解析結果から検索して、得られた属性値に基づいて自然言語文を各プラクティス活動の種類に分類するとともに、得られた属性値の属性名に基づいて、WhatやHowに関する重要語句を抽出する。 (もっと読む)


21 - 23 / 23