説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

101 - 120 / 258


【課題】互いに関係を持つ可能性の高い名詞の対のみを精度良く抽出するとともに、それら対をなす2つの名詞の関係も抽出することのできる言語処理装置を提供する。
【解決手段】言語処理装置は、入力テキストデータを基に、一つの文に含まれる単語のペアを処理対象単語ペアとして選択するとともに処理対象単語ペアの出現頻度特徴を抽出する処理対象単語ペア特徴抽出部と、共起単語を選択するとともに、共起単語の出現頻度特徴を抽出する共起単語特徴抽出部と、処理対象単語ペアと共起単語との当該文中の構文構造を抽出するとともに、構文構造の出現頻度特徴を抽出する構文構造特徴抽出部と、得られたこれらの出現頻度特徴のデータを用いて機械学習処理により、処理対象単語ペアの条件付き確率と、共起単語の条件付き確率と、構文構造の条件付き確率とを算出し、学習結果データとして学習結果データ記憶部に書き込む機械学習処理部とを具備する。 (もっと読む)


【課題】利用者から入力された発話内容などの入力情報に基づいて、入力情報から把握される意味内容に関連付けられている予め作成された回答内容を検索し、この検索経緯を参照することで、利用者に対して抱く感情度等を簡単に特定するものである。
【解決手段】本発明は、文字認識手段及び形態素抽出手段によって得られた第一形態素情報に基づき談話範囲決定手段によって決定された談話範囲と、予め決定された現在の談話範囲とを照合して照合結果を得る。また、形態素抽出手段で抽出された第一形態素情報と、前記複数の談話範囲の一つである現在の談話範囲の前記第二形態素情報とを照合し、この第二形態素情報の中に前記第一形態素を含む前記第二形態素情報が存在するかどうかを検索した検索結果を得る。そして、上記の照合結果及び検索結果に基づいて、利用者に対して抱く感情度を決定する。 (もっと読む)


【課題】電子メールやWeb掲示板などのやり取りの際に含まれる引用記号を利用して、同一内容の文書が文の出現順に左右されずに翻訳精度を向上させることである。
【解決手段】文書階層判定部30は、第一言語文書の文の先頭に引用記号が存在するか否かを判定し、引用記号が存在するときは文の先頭からの引用記号の個数を引用形式の階層と判定し、引用形式の階層ごとに第一言語文書の文を文書記憶部32に格納する。翻訳部29は、文書記憶部32に格納された文のうち引用形式の階層が深い順に、翻訳知識情報格納部33に格納された翻訳知識情報を利用して翻訳を行い、その翻訳の際に使用した翻訳辞書の語彙部や変換規則から訳語を選択するに有用な翻訳知識情報を取り出し翻訳知識情報格納部33に格納する。出力部28は、翻訳部29で翻訳された翻訳結果を出力装置17に出力する。 (もっと読む)


【課題】評判情報の抽出処理において、新規の表現を辞書に自動的に登録する。
【解決手段】評価辞書と属性辞書を参照することにより、テキストから評価表現と属性表現の組である評判情報を抽出する機能を有する評判情報抽出装置において、文から抽出した文節ペアを構成する2つの文節のうちの一方の文節が前記評価辞書内の評価表現を含み、他方の文節はいずれの辞書内の表現も含まないと判定された場合に、前記他方の文節を属性辞書追加候補文節であると判定し、前記一方の文節が前記属性辞書内の属性表現を含み、前記他方の文節はいずれの辞書内の表現も含まないと判定された場合に、前記他方の文節を、評価辞書追加候補文節であると判定する手段と、前記評価辞書追加候補文節又は前記属性辞書追加候補文節から、評価表現又は属性表現を抽出し、新規の表現として前記評価辞書又は前記属性辞書に追加する手段とを備える。 (もっと読む)


【課題】品詞を判定のために必要なデータの作成労力を軽減することができる中国語の品詞判定装置を提供する。
【解決手段】日本語の単語列と、日本語の単語列に含まれる単語それぞれの日本語の品詞とを対応づけて記憶する単語列記憶部122と、日本語の品詞と、中国語の品詞とを対応づけて記憶する品詞対応記憶部123と、中国語の単語列を入力する入力部101と、入力された中国語の単語列を日本語の単語列に翻訳する翻訳部102と、翻訳された日本語の単語列に含まれる単語それぞれに対応する日本語の品詞を単語列記憶部122から検索する検索部103と、日本語の品詞が検索された日本語の単語の翻訳元である中国語の単語は、検索された日本語の品詞に対応する品詞対応記憶部123の中国語の品詞であると判定する判定部105と、を備えた。 (もっと読む)


【課題】 文書群を利用して、クエリと類似の用語、クエリと類似の文、クエリと類似の関係性を抽出すること。
【解決手段】 文書中の文を構文解析する構文解析処理部と、前記構文解析により得られる構文木から部分構文木およびその構成要素のインデックスを作成するインデックス作成部とを少なくとも有する前処理装置と、検索用語、検索文、及び検索条件の入力を受け付ける入力装置と、当該入力された検索文、検索用語を含む文もしくは検索条件を満たす文の部分構文木/構成要素のプロファイルを計算する手段と、それらの部分構文木/構成要素のプロファイルに類似のプロファイルを有する文、用語群、用語ペア群を計算する手段と、前記計算結果を提示する手段を少なくとも具備する検索システムを提供する。 (もっと読む)


【課題】 ある属性を評価する際に、その属性のどの点に着目して評価したかを知ることが可能な着眼点抽出装置を提供する。
【解決手段】 キーワードが指定されると、記事データ取得手段30は、指定されたキーワードを含む記事データを記事データ記憶手段10から抽出する。着眼ワード取得手段40は、着眼ワード記憶手段60に記憶された着眼ワードが、抽出された記事データに存在するかどうかを確認し、存在する場合には、その着眼ワードを取得する。着眼文作成手段50は、抽出した記事データにおける着眼ワードの係り受け情報を利用して、着眼ワードを含む着眼文を作成する。 (もっと読む)


【課題】固有名詞や慣用句等の固有表現を識別した上で正確に文節切りすることができ、精度よく評価表現を抽出する。
【解決手段】入力文テキストデータに対して形態素解析を行い、形態素を列記した形態素解析結果データを生成する形態素解析工程と、前記形態素解析結果データに対して、固有表現に含まれる形態素を識別する固有表現ラベルデータを付与して固有表現抽出結果データを生成する固有表現抽出工程と、前記固有表現抽出結果データに対して、文節に含まれる形態素を識別する文節ラベルデータを付与して文節切り結果データを生成する文節切り工程と、前記文節切り結果データに対して、文節の係り受け関係を識別する係り受けラベルデータを付与して係り受け解析結果データを生成する係り受け解析工程と、前記係り受け解析結果データから、評価表現を構成する対象語、属性語もしくは評価語を抽出する評価表現抽出工程とを備える。 (もっと読む)


【課題】付属語から必須表層格への適切な変換ルールである格変換ルールを自動学習し出力する。
【解決手段】辞書作成装置10は、構文解析部101、主辞特定部103、主辞間係り受け解析部104、格変換ルール学習部105、構文解析結果テーブル120、主辞テーブル121および項構造正解テーブル123等から構成され、構文解析部101はテキストを構文解析し、文節集合の係り受け関係を、構文解析結果テーブル120に格納する。主辞特定部103が文節の意味的主辞を特定し、文節内の自立語と判定された単語を意味的主辞として主辞テーブル121に格納する。主辞間係り受け解析部104が、各主辞の属する文節内で非自立語全体を付属語として主辞テーブル121に追加し、その後、格変換ルール学習部105が、格変換ルールを学習する。学習部105が動作性名詞について、必須表層格を格納した項構造正解テーブル123を作成する。 (もっと読む)


【課題】学習データを必要とせずにテキストセグメンテーションが可能なWeb検索を利用したテキストセグメンテーションを実現する。
【解決手段】本発明は、入力されたテキストを文単位に分割し、分割された文を形態素解析し、形態素解析された名詞、副詞、動詞、形容詞、形容動詞を検索語として抽出し、検索語に基づいてウェブ検索したテキストを形態素解析し、解析された形態素のうちで、名詞、副詞、動詞、形容詞、形容動詞を関連語として取得し、検索語と関連語との組み合わせであるキーワード集合を用いて、入力テキストを分割した複数の文同士の連結性を判定し、該連結性の谷と谷の間にある文同士である意味段落を抽出することによって入力テキストを分割する。 (もっと読む)


【課題】適切な変換ルールが記述された格変換ルールを用いて必須表層格を得る。
【解決手段】述語または動作性名詞おそれ以外の単語または単語属性間の係り受け状態を述語または動作性名詞とそれ以外の単語との格関係へ変換する規則を記憶した格変換規則テーブル2を設け、テキストの係り受け状態および格変換規則テーブル2の規則を用いて、格変換部3にて入力されたテキストを述語および動作性名詞の項構造に変換して出力する。 (もっと読む)


【課題】照応解析結果において得られた照応関係の真偽判定を行なう装置、方法を提供する。
【解決手段】既存の照応解析システムにおいて照応関係ありと判定された名詞の中から、動作を表す名詞を選択し、選択された動作を表す名詞のテキスト近傍から「名詞の[実体(参照先)]を左右する動詞」を選択して、この選択動詞に対応する格要素、例えば、主格(SUBJ)、目的格(OBJ)、斜格(OBL)、修飾句(ADJUNCT)などを取得して、取得した対応格要素の実体(参照先)の同一性を判定し、同一性なしと判定された場合に名詞の照応関係はないと判定する。この処理構成により精度の高い照応関係の真偽判定を行なうことが可能となる。 (もっと読む)


【課題】 翻訳対象となる日本語の文法的正確さを、翻訳前に確認する手段を提供する。
【解決手段】 日本語による翻訳対象文を異言語への翻訳に先立ち前編集する翻訳支援装置であって、利用者が入力した翻訳対象文を受け付ける翻訳対象文受付手段と、前記翻訳対象文受付手段が受け付けた前記翻訳対象文を形態素解析する形態素解析手段と、前記形態素解析手段が解析した形態素情報を構文解析し、翻訳対象文における主語候補および述語候補を特定する構文解析手段と、前記構文解析手段が特定した主語候補および述語候補を表示する表示手段とを備える、翻訳支援装置に関する。 (もっと読む)


【課題】音声翻訳の質を向上することができる音声翻訳方法及び装置を提供する。
【解決手段】入力音声を音声認識した結果得られるテキスト中の長文を、複数のn−グラムとそのそれぞれの確率とを含む分割モデルを用いて、1組の主部と述部からなる単文単位に分割し、各単文をターゲット言語の文に翻訳する。長文の中の分割位置が修正された場合には、修正後の新たな分割位置で該長文を単文単位に分割する。 (もっと読む)


【課題】 入力されたキーワードに基づいて複数の電子文書が検索された場合に、キーワードの示す対象や事柄の存否を考慮した順位にて検索結果が出力されるようにする。
【解決手段】 文書格納手段1に格納されている電子文書について、構文解析手段2が文を解析して構文の係り受け構造を求め、意味解析手段3が構文解析結果から意味表現を求め、知識解析手段4が文脈情報や事象関係を含むような知識表現を意味表現から求める。そして、索引抽出手段5が知識表現から索引語を抽出すると共に、当該索引語が表す対象の存在に関する文脈情報を抽出して索引語の重み値を求め、索引語と重み値とを対応付けて索引格納手段6に電子文書毎に格納する。検索手段7は、入力されたキーワードを索引語に含む文書格納手段1中の各文書を、その索引語の重み値が大きい順に表示する。 (もっと読む)


【課題】係り受け関係同士の関係に着目して、文書データ解析を支援する。
【解決手段】係り受け関係検索条件入力部16は、取り出したい係り受け関係を指定する。修飾関係の検索では、「係り先のチャンク(右)」、「係り元のチャンク(左)」、「連体修飾先のチャンク(右)」、「連体修飾元のチャンク(左)」の1つまたは複数の指定、距離の指定、キーワードおよびその検索位置(係り部か受け部か、またはその双方)の指定がなされる。係り受け関係検索部17は係り受け関係集合記憶部15のメタ意味チャンク記憶部15bを参照して該当する係り受け関係(基礎意味チャンク)を抽出する。表示部19は検索結果の係り受け関係集合を表示する。 (もっと読む)


【課題】 表記が異なるが同じ概念を表す同義語と推定される単語の組を効率よく抽出する。
【解決手段】 類似文書発見手段2が、文書収集手段1に記憶されている電子カルテのうち記述内容が類似するものを選出し、専門用語抽出手段3が、前記選出された類似の電子カルテの記述に出現する診療に関する単語を抽出し、同一表記語抽出手段4が、前記抽出された各単語のうち、各電子カルテに共通して出現する共通語を特定する。そして、表記違い語対応抽出手段5が、前記抽出された各単語のうちの共通語以外で且つ異なる電子カルテから抽出された単語の組を対象に、各単語の概念が同一であるか(同義語であるか)を判定し、対応表構成手段6が、同義語と判定された単語の組を対応表形式で出力する。 (もっと読む)


【課題】分析対象の文単位集合全体における代表的な複数の語およびそれら語の間の関係をグラフ表示して文単位集合全体の傾向を示唆する。
【解決手段】語出現データ記憶部150は、語がどのメッセージで出現するかを示す語出現データを保持する。頻度計算部170は、対象語の各々が出現するメッセージが、対象メッセージ集合内にいくつあるかを計算する。語特定部180は、頻度計算部170で計算された頻度に基づいて、頻度が1位からL位までのL個の語を特定する。部分集合導出部160は、部分集合を導出して対応する語を特定し、ノードデータおよびリンクデータを生成する。グラフ表示部190は部分集合導出部160からノードデータおよびリンクデータを取得してグラフのネットワーク構造を決定しグラフ表示を行う。 (もっと読む)


【課題】 読影レポートを自由な表現で記述でき、且つ、必須記入要件の記述漏れの防止を図る技術を提案する。
【解決手段】 読影レポートに用いる述語の述語タイプと該述語を修飾すべき複数の格要素語の格要素タイプとを定義した定義情報、および、格要素タイプと医療要件名との対応付けルールをルール保持手段31に保持しており、読影レポートに対する文字列入力を利用者から受け付けると、テキスト解析手段21が、構文意味解析を行って、当該文字列中の述語及びその述語タイプと該述語を修飾する格要素語及びその格要素タイプとを示す構造情報を取得し、解析欠陥処理手段32が、当該構造情報に応じた定義情報中の各格要素タイプについて、該格要素タイプが当該構造情報に含まれるか否かを判定し、当該構造情報に含まれない格要素タイプの医療要件名を警告表示手段41により画面表示させる。 (もっと読む)


【課題】学習なしに構文情報を考慮した機械翻訳を実現する機械翻訳装置を提供する。
【解決手段】原言語の翻訳対象テキストが記憶される翻訳対象テキストデータ記憶部11、翻訳モデルが記憶される翻訳モデル情報記憶部12、翻訳モデルを用いて翻訳対象テキストを統計的に機械翻訳する機械翻訳部13、翻訳後テキストを蓄積する翻訳後テキストデータ蓄積部14、翻訳対象テキストを構文解析して木構造情報を得る構文解析部15、木構造情報を蓄積する木構造情報蓄積部16、翻訳後テキストを、木構造情報の示す木構造のリーフの原言語から目的言語への変換と、その木構造のノードの入れ替えによって実現できるか判断する判断部18、木構造のリーフの変換とノードの入れ替えによって実現できると判断部18が判断した翻訳後テキストを選択する選択部19、選択結果を出力する出力部20を備える。 (もっと読む)


101 - 120 / 258