説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

41 - 60 / 258


【課題】複数の言語で記述された文集合から個別言語の文法と共に言語共通の文法を推定する技術を提供すること。
【解決手段】多言語文法解析装置1は、個別文法パラメータ集合46と、共通文法パラメータ集合45と、入力多言語データ44とを記憶する記憶手段4と、言語毎に、記憶されている情報に基づいて、構文木確率を推定する処理と、記憶されている情報および推定された構文木確率に基づいて、個別文法のパラメータを推定して更新する処理とを交互に実行することで、各言語の文法を推定する個別文法推定部21と、更新された各言語の個別文法のパラメータと、記憶されている共通文法パラメータとに基づいて、新たな共通文法パラメータを推定して更新する共通文法推定部22と、各言語の文法を推定する処理と、言語共通の文法を推定する処理とを終了条件が満たされるまで交互に繰り返し実行させる推定処理制御部23とを備える。 (もっと読む)


【課題】構造写像理論に基づく類推方式によって精度良くある程度正しい解を得る。
【解決手段】類推システムは、類推に用いられる知識情報が蓄積されたコーパス10と、写像対象となるベース1,2との関係Rを抽出する関係抽出モジュール20と、抽出された関係Rをターゲットに写像する関係写像モジュール30とを備える。そして、コーパス10からベース1,2が同時に出現する文を抽出し、抽出された文から関係Rを表す単語rを抽出する。また、ターゲットに関係Rを写像して、ターゲットと単語rとが同時に出現する文をコーパス10から抽出し、抽出された文から関係Rに基づく解Xの候補となる単語xを抽出することを、全ての単語rについて行う。そして、算出された所属度gradeX(x)の値が高い所定数の単語xを解Xに含まれるターゲットに関係する候補語として抽出する。 (もっと読む)


【課題】固有表現を正しくかつ詳細に分類することを可能とする固有表現抽出装置、固有表現抽出方法、固有表現抽出プログラムを提供する。
【解決手段】テキストを入力とし、形態素と係り受け解析結果と固有表現を出力するテキスト解析部1100と、形態素と固有表現を入力とし、トピックを抽出するトピック抽出部1210と、係り受け解析結果を入力とし、文構造を出力する文構造抽出部1220と、固有表現クラスを判定して出力するクラス判定部1230と、シソーラス1240と、文字列−固有表現クラス対データベース1250と、トピックと文構造と固有表現クラスを入力とし、ラベルスコアを出力とするラベルスコア計算部1300と、ラベルごとのラベルスコア計算に用いられるラベル判定モデル1310と、ラベルスコア最大値からラベルを判定するラベル判定部1400と、前記判定されたラベルと固有表現の組を出力する出力部1500とを備える。 (もっと読む)


【課題】解析対象の文を文末まで形態素解析しなくても、文字ごとの係り受け関係を決定することが可能な自然言語解析装置、方法及びプログラムを提供すること。
【解決手段】自然言語解析装置10は、解析対象の文を構成する文字を文字単位で取得し、取得した文字ごとの依存関係を決定する。そして、自然言語解析装置10は、当該解析対象の文の先頭文字から順にこの文字ごとの依存関係を決定する過程で、係り先が未確定の文字を依存先未決スタック107にスタックしていき、依存関係の判定により文字の係り先が決定した後に、依存先未決スタック107に蓄積された文字の依存関係の決定を行って文字の係り受けを決定する。 (もっと読む)


【課題】複数のソース言語単語セグメント化方式をSMTデコード処理に統合して翻訳の品質を高める、単語セグメント化システム及び単語セグメント化方法を提供する。
【解決手段】句テーブル生成器10は、翻訳対のバイリンガルコーパス32及び34を記憶する記憶部30を含む。翻訳対の各々は第1の言語34のソース文と、第2の言語32のターゲット文とを含む。生成器はさらに、コーパスを利用して統計的機械翻訳機(SMT)をトレーニングする分類器トレーニング装置12を含む。SMTはトレーニングの間に句テーブル16を出力する。生成器10はさらに、複数の句テーブル16を統合された句テーブル20に統合するための句テーブルマージ部18を含む。 (もっと読む)


【課題】テキスト全体または1文に書かれている言語表現の感情極性の自動推定を高精度に行う。
【解決手段】推定すべき性質を示す述語間の関係を記述した論理式を感情極性の推定に用いる論理式として保存し、上記論理式により構築されるマルコフ論理ネットワークにより、1文感情極性とテキスト全体の感情極性を同時に推定するための感情極性推定用論理式の重みを学習するための学習コーパスデータを学習コーパスデータ保存手段に保存された学習コーパスデータを用いて、上記マルコフ論理ネットワークについて、1文感情極性とテキスト全体の感情極性を同時に推定するための感情極性推定用論理式の重みを学習処理モジュールにより学習し、得られた上記感情極性推定用論理式の重みデータを保存し、保存されたテキストデータについて、保存された感情極性推定用論理式の重みデータを用いて、1文感情極性とテキスト全体の感情極性を同時に推定する。 (もっと読む)


【課題】第1自然言語(日本語)の文章の中で省略されている用語を適切に補完して、第2自然言語(英語)に翻訳しやすいような第1自然言語(日本語)の文章を作成する。
【解決手段】ユーザ端末10から日本語による情報を入力すると、情報記録手段20が、ユーザ端末10によって入力された日本語による入力情報を記録する。そして、解析手段40が、情報記録手段20に記録されている入力情報を抽出して形態素解析を行い、用語と品詞との関係を示す修飾要素と情報記録手段20ごとに記録された入力情報とに基づいて専用辞書を作成する。そして、解析手段40は、形態素解析によって得られた第1の情報と専用辞書に記録されている第2の情報とを比較し、ユーザ端末10から入力された日本語による文章に対して付与可能な修飾要素を検出し、検出された付与可能な修飾要素に基づいて、日本語による文章の中で省略されている用語を補完する。 (もっと読む)


【課題】非主辞後置型言語である原言語(例えば英語)の文の単語について、構文解析結果を用いて、主辞後置型言語の目的言語(例えば日本語)の語順に並び替えることを課題とする。
【解決手段】非主辞後置型言語である原言語の文の単語を、主辞後置型言語である目的言語の語順に並び替える語順変換装置100である。処理部101は、原言語の文について、その構造木のルートノードから始めてすべてのノードについて、その子ノードのうち、語順を変えるべきでないノード以外のノードに対して、主辞ノードを最後の位置に移動する処理を繰り返すことで、原言語の文の単語を目的言語の語順に並び替える。 (もっと読む)


【課題】出現頻度以外に基づき重要語を選択することができる重要語抽出技術を提供することを目的とする。
【解決手段】入力テキストから1つ以上の名詞の連語または固有名詞である重要語候補を抽出し、入力テキストから入力テキスト作成者の行動を記述する際に現れる行動表現を特徴語として抽出し、重要語候補が備える性質を表す素性を、各重要語候補に対し1つ以上抽出し、機械学習により予め定められた分類ルールに基づき、素性を用いて重要度スコアを算出し、重要度スコアから重要語を決定する。素性を抽出する際に、行動表現に係る重要語候補であるか否かを表す係り受け構造情報を素性として、その重要語候補に付与する。 (もっと読む)


【課題】「近傍の単語は互いに関係がある」という仮定に基づきながらも、その仮定が成立していない可能性をも考慮した、文脈情報を利用した統計的自然言語処理を確立する。
【解決手段】ステップS1で、処理対象の文書が特徴量抽出部に入力され、ステップS2で、特徴量抽出部が、処理対象の文書に含まれる文脈情報毎に特徴量を抽出する。ステップS3で、特徴量解析部は、処理対象の文書の各文脈情報の特徴量に対応する潜在変数をギブスサンプリングにより推定する。ステップS4で、クラスタリング処理部は、各文脈の文脈トピック比を新たな特徴量ベクトルとみなし、この特徴量ベクトルに基づいて、文脈情報(の固有名詞ペア)のクラスタリングを行う。ステップS5で、基本情報生成部は、解析結果DBに保持されているクラスタリング結果に基づいて基本情報を生成する。本発明は、文書の統計的自然言語処理に適用することができる。 (もっと読む)


【課題】単語の羅列による検索クエリであっても、その単語の意味を推定することができる意味属性推定装置、方法及びプログラムを提供すること。
【解決手段】検索クエリ取得手段(111)が端末から検索クエリを取得すると、助詞挿入手段(112)が検索クエリに助詞を挿入した複数の仮文を作成する。そして、作成された複数の仮文それぞれについて検索手段(113)が検索すると、最大頻度語句抽出手段(114)は、その検索結果から最も一致した数の多い仮文を抽出する。一致した数の多い仮文は、使用される頻度が高いといえるので、意味属性情報取得手段(115)は、その仮文に含まれる単語の意味属性情報を取得する。これにより、意味属性推定装置(10)は、検索クエリに使用された単語の意味属性情報を出力することができる。 (もっと読む)


【課題】意味分類付与の精度を向上させる。
【解決手段】特徴重みテーブル3は、あらかじめテキストの特徴と意味分類との間の関連性を示す特徴重みとして、語句の後続機能表現と該後続機能表現の係る語句との意味分類の異同を特徴とする重みを保持する。スコア算出部4は、入力部2で受け付けたテキスト中の注目単語の特徴をキーとして前記テーブル3を探索し、該単語に付与する意味分類タグ候補とスコアを算出する。意味分類付与手段5は、意味分類タグ候補の系列のうちスコア総和が最大となる系列を選択し、入力テキスト中の各単語に該意味分類タグを付与した意味分類付与結果を出力する。 (もっと読む)


【課題】株価に影響を与えるイベントの有無を自動的に検知すると共に、このイベントによって株価に影響を受ける具体的な企業名を提示可能な技術の実現。
【解決手段】イベント情報を格納するイベント情報記憶部38と、各企業の属性情報を登録しておくオントロジ記憶部42と、イベントの属性と当該イベントによって株価に影響を受ける企業の属性との組合せパターン毎に、株価に与える影響がプラスかマイナスかを定義した推論ルールを格納する推論ルール記憶部40と、各イベント情報に対して推論ルールを適用し、当該イベントによって株価に影響が及ぶ企業の属性を特定すると共に、オントロジ記憶部42を参照して当該属性を備えた企業を株価影響企業として抽出し、株価影響企業のリストを生成してWebサーバ44に出力する株価影響企業抽出部26を備えた株価影響企業検知システム10。 (もっと読む)


【課題】ウェブ・ページに適したキーワードを決定する。
【解決手段】関連するキーワードを決定したい単語を入力する。入力された単語に関連するウェブ・ページが見つけられる。見つけられたウェブ・ページのメタ・タグに記述されているキーワード(プログラム言語,オブジェクト指向,教育,セミナー)が抽出される。入力された単語の専門辞書が登録されている辞書サーバに抽出されたキーワードが送信される。その辞書サーバに,送信されたキーワードが登録されていれば,そのキーワードは入力された単語に関連するキーワードと決定される。 (もっと読む)


【課題】学習対象の文に関連付けられた、構文解析器の構文解析の仕様とは異なる構文解析の仕様を、構文解析器の構文解析の仕様に合わせるために学習する自然言語処理プログラム及び自然言語処理装置を提供する。
【解決手段】コーパス変換装置1は、仕様Bの構文情報111Bに基づいて、学習コーパス111の文に構文解析の対象とする範囲の限定をブラケットによって付与するブラケット付与手段101と、ブラケットの付与前及び付与後において、文に仕様Aで構文解析を実行して、構文解析結果をそれぞれ出力する構文解析手段102と、構文情報111Aとブラケットの付与前及び付与後における構文解析結果との類似性を示すF値をそれぞれ求める構文解析評価手段103と、ブラケットの付与前及び付与後におけるF値の変化量と、ブラケット付与後の構文解析結果とを関連付けて学習する学習手段105とを有する。 (もっと読む)


【課題】言語学的に導かれた単語の分離ツールが不要な文分離器トレーニング装置を提供する。
【解決手段】文分離器は、文字ベースの分離器、バイリンガルコーパスを利用してSMTをトレーニングする第1のトレーナ、SMTの評価器、SMTによる対応付け結果を用い第2の分離器をトレーニングする第2のトレーナ、第2のトレーナによりトレーニングされた第2の分離器を利用してソース文をセグメント化するセグメント化装置、第1及び第2のトレーナ、評価器、並びに第2の分離器を、性能が悪くなるまで繰返し動作させる制御器、最初は第1の分離器によってセグメント化されたコーパスを、以降の繰返しでは第2の分離器によりセグメント化されたコーパスを選択してレーニングコーパスとして第1のトレーナに与える選択器とを含む。 (もっと読む)


【課題】文書データの解析において、解析対象の文章の係り受け関係が考慮された、正確なパターン抽出を行うことを課題とする。
【解決手段】複数の対象データを含む文書データを解析するための文書データ解析装置に、正規表現を用いて定義された複数の検索キーを保持する保持部22と、保持された複数の検索キーを用いて複数の対象データを検索する検索部24と、検索の結果を参照することで、対象データが、夫々、関連する検索キーの組み合わせとして予め定義された検索キー関係を含むか否かを判定する判定部25と、複数の対象データ全体における検索キー関係の出現頻度または出現率を所定の閾値と比較し、所定の閾値以上である検索キー関係をパターンとして抽出する、パターン抽出部26と、を備えた。 (もっと読む)


【課題】不要語辞書を効率的に作成し、かつ、抽出もれの少ない強化語リストを作成する。
【解決手段】対象トピック観点と、テキストの中で対象トピック観点について記述されている範囲とから、対象トピック観点に対応する具体表現辞書に登録する可能性のある候補のリストである「候補語リスト」を作成する。具体表現辞書と係り受けルールとを使って、具体表現辞書に登録されている単語を含む2単語の係り受け関係を抽出し、係り受け関係を基に不要語を抽出するためのルールを作成し、具体表現辞書に登録されていない単語を不要語として抽出し、不要語辞書に格納する。対応する候補語リストと、対応する不要語辞書とをつきあわせ、候補語リストから、不要語辞書に登録されている単語を削除し、削除されなかった単語は強化語リストに追加する。対象トピック観点に対応する強化語リストを対応する具体表現辞書に追加する。 (もっと読む)


【課題】表現の表層の統計的特徴のみではなく、意味に基づいて、文が所定の文カテゴリーに属するか否かを判定する。
【解決手段】構文解析木データから意見性述語を検出し、検出した意見性述語の述語カテゴリーを含む意見性述語情報を構文解析木データに付加する述語検出部と、形態素解析処理が行われた入力文データに基づいて、入力文データの機能表現を検出し、その種類を表わす機能表現タイプを含む機能表現情報を構文解析木データに付加する機能表現検出部と、意見性述語情報および機能表現情報が付加された構文解析木データを読み込み、その構文解析木データの特徴を用いて当該構文解析木データが所定の文カテゴリーに該当するか否かを判断する判断部とを具備する意見分類装置を構成する。 (もっと読む)


【課題】意味が未知の単語に対して当該単語の意味を関係付けることを可能とする。
【解決手段】情報入力部31は、文書を入力する。単語情報抽出処理部32は、情報入力部31によって入力された文書に含まれる複数の文字列のうちの第1の文字列を抽出する。意味関係情報解析処理部34は、オントロジー格納部22に格納されているオントロジーにおいて、第1の文字列を示すインスタンスに対応づけられている意味クラスを一意に決定することができない場合、情報入力部31によって入力された文書に含まれる複数の文字列のうち、第1の文字列と共起関係にある第2の文字列を示すインスタンスであって、当該オントロジーにおいて意味クラスを一意に決定することができるインスタンスを特定する。意味関係情報解析処理部34は、特定されたインスタンスに対応づけられている意味クラスに基づいて決定された意味クラスをオントロジー格納部22に登録する。 (もっと読む)


41 - 60 / 258