説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

21 - 40 / 258


【課題】曖昧文を検出する際に、過剰検出や不適切な指摘内容の発生を低減させ、曖昧文の検出精度を向上できる。
【解決手段】実施形態の構文解析手段は、前記入力を受け付けた文を構文解析し、構文解析結果を得る。実施形態の抽出手段は、この構文解析結果に基づいて、前記場合に該当する文の構文解析結果から係り受け元、複数の係り受け先を含む係り受け情報を抽出する。実施形態の関係情報補正手段は、前記構文解析結果及び前記関係情報補正ルールに基づいて、前記係り受け情報が前記第1乃至第4の関係のいずれかに該当するか否かを検査すし、該当する係り受け情報に対して、前記関係情報補正ルールに規定された補正処理を行う。実施形態の指摘情報生成手段は、前記関係情報補正手段による処理の結果に基づいて、前記第1乃至第4の関係のいずれにも該当しないとき、前記曖昧文である旨を指摘する指摘情報を生成し、この指摘情報を出力する。 (もっと読む)


【課題】利用者による操作入力に基づく作成中の文について、その続きに入力されることが予測される候補を提示するに際し、文が有する係り受け関係の情報を用いて候補となる語を提示する。
【解決手段】テキスト分割部32が、テキスト取得部31により得られた作成中(編集中)の文を形態素解析して形態素単位の語(文字列)に分割し、構文・意味解析部33がテキスト分割部32により得られた各語の係り関係及び意味役割を解析し、補完候補評価部34が、構文・意味解析部33による解析結果(文字入力位置の前の語に対する他の語の係り関係及び意味役割の関係)に基づいて、各種スコアDB12を参照して補完入力候補となる候補語を検索すると共に各候補語のスコアを算出し、補完候補提示部36が、補完候補評価部34により得られた候補語をスコア順に提示する。 (もっと読む)


【課題】同じ表層形を持つ機能表現が複数存在していても、形態素列に適切な意味ラベルを選択する。
【解決手段】本発明の素性重み学習装置と機能表現解析装置は、ラティス構築手段と最尤パス探索手段とを有するデコーディング部を備える。ラティス構築手段は、入力された形態素列に対して、意味ラベルが付与されたフレーズラティスを作成する。フレーズラティスは、機能表現辞書と形態素列表記が一致するフレーズ、機能語に分類される品詞を持つ形態素のフレーズ、述語に分類される品詞を持つ形態素のフレーズ、述語および機能表現ではないことを示す形態素のフレーズを含む。最尤パス探索手段は、素性に対する重みを格納したパラメータテーブルを用いてフレーズラティスから尤もらしいパスである最尤パスを探索する。素性には、形態素列と意味ラベルを対応つける素性と意味ラベル列を表す素性の両方が含まれる。 (もっと読む)


【課題】事前に与えた基準を守りつつ、それと異なる新しい文字列又は記号列を高精度に分割する。
【解決手段】識別モデルパラメータ更新部25によって、NPYLMをCRFに変換し、変換したCRFの各エッジの重みと、CRFにおける対応するエッジの重みとを用いて第1の統合モデルを作成し、第1の統合モデルを、教師ありデータに基づいて学習する。生成モデルパラメータ更新部26によって、CRFをSemi−Markov CRFに変換し、Semi−Markov CRFの各エッジの重みとNPYLMの対応するエッジの重みとを用いて第2の統合モデルを作成し、第2の統合モデルを、教師なしデータに基づいて学習する。収束判定部27によって所定の収束条件を満たしたと判定されるまで、識別モデルパラメータ更新部25による更新と生成モデルパラメータ更新部26による更新とを交互に繰り返す。 (もっと読む)


【課題】 目的語と述語が離れている文の検出精度を向上させる。
【解決手段】 実施形態の言語解析手段は、前記入力を受け付けた文を言語解析し、言語解析結果を得る。実施形態の抽出手段は、前記言語解析結果から前記文の目的語と述語を抽出する。実施形態の距離診断手段は、前記抽出された目的語と述語との前記文内での距離が予め設定された基準よりも大きいか否かを診断する。実施形態の述語省略診断手段は、前記距離診断手段による診断の結果、距離が大きい場合、前記抽出された目的語と前記言語解析手段による言語解析結果と前記述語省略診断ルールとに基づいて、当該目的語に対して述語が省略されている場合に該当するか否かを診断する。実施形態の第1の指摘情報生成手段は、前記述語省略診断手段による診断の結果、該当しない場合、前記目的語と前記述語とが離れている旨の指摘情報を生成し、この指摘情報を出力する。 (もっと読む)


【課題】単語の意味情報を記録したデータベース(例えば感情関係語DB)を用いずに、対象音声データまたは対象テキストデータから感情を推定する感情推定装置、その方法、そのプログラム及びその記録媒体を提供することを目的とする。
【解決手段】対象テキストデータの形態素解析結果と構文解析結果との少なくとも一方を用いて、対象テキストデータ内にどの程度その意味内容が明示されているかを表す明示性特徴量を推定し、怒りの感情が表現されているか否かを示す教師信号付きの学習用テキストデータの明示性特徴量から予め学習された識別器を用いて、対象テキストデータ内に怒りの感情が表現されているか否かを、明示性推定部で推定された対象テキストデータの明示性特徴量から識別する。 (もっと読む)


【課題】利用者による質問の焦点を精度良く推定し、回答すること。
【解決手段】質問応答システム10は、利用者が質問を入力する音声入力部11と、入力された質問の構文を解析する音声認識部12と、解析結果に基づき入力された質問の種類を判定する質問タイプ同定部15と、質問タイプ同定部15により入力された質問の種類がYes又はNoで回答できる種類であると判定された場合に、入力された質問の焦点を決定する焦点解析部16と、焦点解析部16により決定された焦点に応じて、適切な回答文を生成する回答文生成部17と、あらかじめ焦点となる文節の位置が設定された解析済み文を記憶する文例データベース18と、を備える。焦点解析部16は、入力された質問文と前記解析済み文との、それぞれの最終文節の働きの比較と、当該最終文節に係る文節の機能語の比較と、当該機能語の出現順とに基づいて、入力された質問の焦点を決定する。 (もっと読む)


【課題】形式言語処理パーサーにFP以外の文字列処理関数、例えば、自然言語処理パーサーを組み合わせたパーサーを自動的に生成する手法を提供する。
【解決手段】文法記述は、第1の文法記述(P1)に関連付けられた第1のパーサーを使用して、入力文字列(str)の先頭文字列から第2の文法記述(P2)に関連付けられた第2のパーサーで最初に受理可能な少なくとも1つのstrの直前の入力文字列までをパーズし、P2を使用して、当該第2のパーサーで最初に受理可能な少なくとも1つのstrをパーズする文法記述P1 U P2; P2に関連付けられた第2のパーサーを使用して、当該第2のパーサーで受理可能であり且つstrの先頭文字列を含む少なくとも1つのstrをパーズし、P1に関連付けられた第1のパーサーを使用して、当該パーズされた少なくとも1つのstrをパーズする文法記述P1 F P2である。 (もっと読む)


【課題】異なる複数の文章に含まれる単語を用いて同義語を検出することが可能であって、汎用性を有し、幅広く同義語を定義することが可能な同義語辞書生成装置等を提供する。
【解決手段】文書解析システム100は、入力インターフェース110を介して取得した各アンケートデータに対して、評価表現を示す評価表現テキストと当該評価テキストが修飾する被修飾語テキストのセットをテキストセットとして抽出しつつ、評価表現テキスト、カテゴリ情報及び被修飾語テキストの出現頻度数に基づいて同義語を定義するようになっている。 (もっと読む)


【課題】述語項構造解析において、大規模かつ高精度な格フレーム辞書を利用することなく、モデルの複雑さを回避し、計算効率を高める文構造解析装置を提供する。
【解決手段】入力された文章を、形態素を単位とした単語に分割する形態素解析手段と、形態素解析手段によって分割された各単語を基に、複数の文節からなる文節列を生成する文節解析手段と、文節解析手段によって生成された各文節間の係り受け関係を解析する係り受け解析手段と、を備え、係り受け解析手段は、文節解析手段によって生成された文節列から、任意の異なる文節のペアを選択し、選択された文節ペアのそれぞれに対して係り受けスコアを計算してメモリに格納し、所定の閾値以上の係り受けスコアを持つ文節ペアに係り受け関係があると解析する。 (もっと読む)


【課題】修飾先の候補を2以上有する形態素を含む文について、当該形態素の修飾先の候補を1つに特定するように当該文を校正する文校正プログラム及び文校正装置を提供する。
【解決手段】文校正装置1は、対象とする文に含まれる形態素を解析する形態素解析手段101と、形態素のうち修飾先の候補を2以上有する形態素を検出する曖昧性検出手段102と、文に対する、連体修飾を受けない少なくとも1つの連用修飾文節の挿入により、曖昧性検出手段102により検出された形態素である修飾先不特定形態素の修飾先の候補が1つとなるように文を校正する文校正手段103とを有する。 (もっと読む)


【課題】一方の文の語句と他方の文の語句とを換言できない場合において、文と文とが互いに関連するか否かを判定する文章解析プログラム及び文章解析装置を提供する。
【解決手段】文章解析プログラム110は、制御部10を、第1の文章から少なくとも、同格であって対となる語句と、当該対となる語句を修飾する語句とを抽出し、それらの対応付けを示す文脈規則情報111を作成する文脈規則情報作成手段102と、第1の文と第2の文とを含む第2の文章において、第1の文の第1の語句及び第2の語句が文脈規則情報111に含まれるときであって、第1の語句及び第2の語句以外の第1の文に含まれる語句、文脈規則情報111の対となる語句の他方及び第2の語句が第2の文に含まれるとき、第1の文と第2の文とが関係すると判定する文章関係判定手段105として機能させる。 (もっと読む)


【課題】文から評価対象に対する発言者の二者択一的な価値評価の他に、発言意図を抽出する技術の実現。
【解決手段】各文が否定評価か肯定評価かを判定し、ネガ/ポジ判定タグを付与するネガ/ポジ判定部22と、各文の主題を認定する主題認定部24と、各文の意図表現に意図類型タグを関連付ける意図抽出部28と、複数の評価軸と類似表現との対応関係を格納した評価軸類似表現記憶部32と、各文の主題が評価軸類似表現記憶部32に格納された類似表現に該当する場合には対応の評価軸を関連付け、評価軸単位でネガ判定タグとポジ判定タグが付与された文の数をそれぞれ集計し、その比率を表すネガ/ポジ分析結果チャートを生成し、評価軸及び意図類型単位で文の数を集計し、意図類型単位での文の総数と、意図類型及び評価軸単位での文の数を表示した意図分類チャートを生成し、各チャートを外部に出力する分析結果評価部36を備えた感性分析システム10。 (もっと読む)


【課題】深い階層を有する特許請求項の構造解析を行う請求項構造情報生成装置を提供する。
【解決手段】記憶部11で記憶される請求項を形態素解析する形態素解析部12、請求項の文節を特定する文節特定部13、記述断片の区切であり記述断片間の関係を示す表層の手がかり情報とトークンとを有する表層区切情報が記憶される表層区切情報記憶部14、請求項の表層の手かがり情報に該当する位置にトークンを付与するトークン付与部15、記述断片の区切となる文節の品詞の手がかり情報と区切文節タイプとを有する文節タイプ対応情報が記憶される文節タイプ対応情報記憶部16、請求項の品詞の手がかり情報に該当する文節に区切文節タイプを付与する区切文節タイプ付与部17、付与されたトークン・区切文節タイプを用いて記述断片の構造を示す請求項構造情報を生成する生成部19、請求項構造情報を出力する出力部20を備える。 (もっと読む)


【課題】あらゆるテキストにおいて、複数の固有表現間の関係情報を抽出可能な装置、その方法及びプログラムを提供する。
【解決手段】入力された複数の固有表現の関係情報を抽出する装置であって、各固有表現を含むテキストが入力されると、入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部10と、入力テキストを構成する複数の文のうち各固有表現を含む文とは異なる他の文から自立語を含む文節を関係情報候補として抽出した後に、各固有表現及び関係情報候補の全てが抽出されるまで入力テキストの文頭から順に抽出された名詞文節を、該名詞文節に伴う助詞に対応付けられた記憶領域に記憶させ、各固有表現及び関係情報候補の全てが抽出されると記憶領域における名詞文節の格納状態を表す格納情報を取得して、解析結果及び格納情報に基づいて関係情報を抽出する関係情報抽出処理部20とを備えた。 (もっと読む)


【課題】 テキスト文書を表現するためのグラフィカル・モデルを用いてテキスト解析を行う方法及びコンピュータ・プログラムを提供する。
【解決手段】 グラフィカル・モデルを用いてテキスト文書を表現するための方法において、複数の順序付けられた単語を含む文書を受け取り、その文書に対するグラフ・データ構造体を生成する。グラフ・データ構造体は、複数のノード及びエッジを含み、各ノードは、文書内の別個の単語を表現し、各エッジは、2つのノードが互いからの所定の距離内に現れる回数を識別する。グラフ・データ構造体は情報レポジトリ内に格納される。 (もっと読む)


【課題】複数の固有表現間の関係情報を高精度で抽出可能な装置、方法及びプログラムを提供する。
【解決手段】入力された複数の固有表現に関係する情報を抽出する装置であって、前記各固有表現を含むテキストが入力されると、入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部10と、解析処理部による解析結果を取得すると、入力テキストに含まれる少なくとも一つの自立語を関係情報候補として抽出するとともに、該各固有表現の関係情報として過去に用いられた過去関係情報が該関係情報候補に経時変化したと推定される度合を表す変化情報を、抽出された関係情報候補毎に取得し、解析結果及び変化情報に基づいて関係情報候補から関係情報を抽出する関係情報抽出処理部20とを備えた。 (もっと読む)


【課題】解析モデルの自動学習における処理速度の向上を図ること。
【解決手段】解析モデル学習装置1は、一度に読み込む訓練データ中の記事数を1記事または少数記事とし、それ以前に読み込まれた記事も含めて解析を行い解析結果の初期値を与えるベースライン解析部2と、訓練用データに対する解析結果を保持する解析結果テーブル3と、解析誤りデータからルールテンプレート5に基づいてルール候補を作成するルール候補作成部4と、それを保持するルール候補テーブル7と、ルール候補の中で最も正味の正解の増加数が大きくなるルールを選択するルール選択部6と、選択されたルールを保持する解析モデルテーブル9と、保持されたルールを、前記テーブル3に保持された訓練データに対する解析結果に適用し解析結果を変換するルール適用部8と、解析モデルテーブル9に保持されたルールを解析モデルとして外部に出力する出力部10とを備える。 (もっと読む)


【課題】文書群に含まれる文書の数に依存することなく文書群を代表する単語を抽出すること。
【解決手段】前処理部11は、代表語の抽出対象となる対象文書群を含む文書群を収集し、基準語取得部13は、代表語を抽出する基準となる基準語を取得する。そして、基準文書特定部14は、前処理部11から入力される文書群から基準語を含む基準文書を特定し、単語群抽出部15は、基準文書から基準語と基準語以外の単語とを単語群として抽出する。そして、指標算出部16は、抽出された単語群の各単語に対して、基準語との共起回数の大小に応じて値が増減する指標を算出する。そして、指標補正部17は、抽出された単語群の各単語に対して、全文書群における希少度と対象文書群における希少度とを算出し、算出した2つの希少度を用いて指標算出部16によって算出された指標を補正する。 (もっと読む)


【課題】不具合を示す述語表現を自動で抽出することのできる技術を提供する。
【解決手段】不具合述語表現抽出装置100は、突然性を示す連用修飾表現または再現性を示す連用修飾語のいずれか一方の近傍に現れる述語表現を、不具合を示す述語表現の候補として抽出し、また、常性を示す連用修飾表現の近傍に現れる述語表現を、正常を示す述語表現として抽出し、不具合を示す述語表現の候補のリストから、正常を示す述語表現を取り除いて、不具合を示す述語表現を抽出する。 (もっと読む)


21 - 40 / 258