説明

Fターム[5B091CA05]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 文解析 (1,092) | 構文解析 (271)

Fターム[5B091CA05]の下位に属するFターム

Fターム[5B091CA05]に分類される特許

121 - 140 / 258


【課題】訳語学習のためのデータの作成負担を軽減する装置を提供すること。
【解決手段】原言語の入力文章を受付ける入力部101と、入力文章に含まれる語句に対する目的言語の訳語と、目的言語の訳語の尤度とを生成する訳語生成部110と、語句と訳語とを対応づけた対応情報を作成する対応情報作成部102と、対応情報に含まれる目的言語の訳語に対して生成された尤度が所定の閾値より大きいか否かを判定する判定部103と、尤度が閾値より大きい目的言語の訳語を含む対応情報に、入力文章に含まれる語句を対応づけた学習データを作成する学習データ作成部104と、を備えた。 (もっと読む)


【課題】接続標識や構文構造だけに頼らず、複文の関係を抽出することのできる節間関係推定装置およびコンピュータプログラムを提供する。
【解決手段】装置が、節ペアに関する意味カテゴリーの組合せと節ペアの関係とを関連付けて保持する関係パラメータ記憶部と、テキストデータから得られた節ペアのデータに当該節ペアの関係を表わすデータを付与する節ペア関係付与部と、節の意味カテゴリーを推定するためのルールを用いて、節ペアに含まれる各節の意味カテゴリーを推定する処理を行ない、推定結果の意味カテゴリーを表わすデータを各節に付与する意味カテゴリー推定部と、節ペアに対応する意味カテゴリーの組合せと節ペア関係付与部によって付与された節ペアの関係との共起頻度を計算し、所定範囲の有意確率を有する意味カテゴリーの組合せと節ペアの関係とを関連付けて関係パラメータ記憶部に書き込む検定処理部を備える。 (もっと読む)


【課題】文書における省略語の部分を自動的に解析して指摘または修正するシステムを提供する。
【解決手段】例えば読影レポートなどの正確性の要求される文書の作成において、省略された語の部分を自動的に解析して指摘する。具体的にはLFGによって得られる意味構造としてのs−structureを用いて省略語の部分を自動的に解析し、解析結果を出力する。さらに、省略された語の部分に入力すべき語を解析して補間する処理や候補語を提示する。これらの構成によれば、ユーザの負担を軽減して文書の正しい修正を行なうことが可能となる。 (もっと読む)


【課題】文章全体として妥当性の高い分割結果を得ることを課題とする。
【解決手段】文章の構造に特有の定型性を有する定型文章を分割する文章分割方法をコンピュータに実行させる文章分割プログラムであって、構造との関係で定型文章の分割に適した箇所が利用者によって文章の属性情報を用いて表現された小節定義が記憶部に予め記憶されている状況で、分割対象となる定型文章を記憶部に記憶されている小節定義に基づいて分割し、分割後の個々の文章である小節を並べた小節列を生成し、定型文章に適した構造が利用者によって小節定義ごとの組み合わせとして表現された構造パターンが記憶部に予め記憶されている状況で、生成した小節列と記憶部に記憶されている構造パターンとを照合し、小節列と一致すると照合された構造パターンを定型文章の分割結果として選択する。 (もっと読む)


【課題】構文パースを使用して正字法バリエーションを有するテキストをセグメント化する方法の提供。
【解決手段】正字法および屈折言語のバリエーション308を構文パーサ316に送ることによりテキストをセグメント化する。可能なセグメントは文字列内で最初に識別される。識別されたセグメントのうち少なくとも2つは互いに重なる。セグメントのうち少なくとも1つについて、他の文字列が識別される。この他の文字列は、セグメントにより識別された単語の異なる語彙形式を識別する、屈折形態論306により形成される。他の文字列はセグメントで識別された単語の正字法バリエーション308を表す場合もある。その後、識別されたセグメントおよび他のセグメントが構文パーサ316に渡され、1つまたは複数の構文解析結果を出力する。解析結果にあるセグメントは、入力文字列のセグメント化を表す。 (もっと読む)


【課題】概念語が表わす概念が有しうる属性として、疑問詞との対応を考慮した属性を判別し、適切な応答生成が行なえるようにする。
【解決手段】様相程度データベース生成部18によって、シソーラスに基づいて定まる概念語の分類名と、属性情報「様相」及び「程度」の各々に対して予め定められた判別ルールとに基づいて、概念語が表わす概念が有することができる属性情報を判別する。また、属性情報データベース生成部20によって、名詞句「AのB」について、属性情報「主体(人間)」、「主体(組織)」、及び「主体(生物)」、「所有者(人間)」、「所有者(組織)」、及び「所有者(生物)」を含む複数の属性情報によって表わされる修飾関係を解析するための修飾関係解析ルールに基づいて、概念語である名詞Aの属性情報を決定し、属性情報の出現頻度に基づいて、概念語の属性情報を判別する。 (もっと読む)


【課題】複数の意味に解釈可能なあいまいな表現を含む文の正しい解析を実現する構成を実現する。
【解決手段】入力文に含まれる形式名詞の役割が先行詞であるか形成子であるかを、形式名詞が独立語または機能語のいずれの性質が強いかの分類情報に基づいて判別する。具体的には、形式名詞が、国語辞書に場所、空間、部分、方向、方角のいずれかの単語が含まれた語義文が対応付けられて登録されている場合、または、形式名詞が前記構文意味解析結果において単独で係り先と格関係にある場合、形式名詞は形成子であると判断し、上記以外の場合は先行詞であると判断する。この判断結果に基づいてより精度の高い構文意味解析結果や翻訳結果を出力可能とした。 (もっと読む)


【課題】例えばf−structureなど特殊な構造を持つ構文意味解析結果に対応する正解コーパスを効率的に生成するシステムを提供する。
【解決手段】初期コーパスの係り受け構造に基づいて初期コーパスの分割文を生成し、分割文の構文意味解析処理により分割文の構文意味解析結果を生成し、生成した分割文の構文意味解析結果を結合して分割処理前のコーパスに対応する構文意味解析結果を生成して正解コーパスとする。本構成によれば例えばLFGシステムによって生成されるf−structureなど特殊な構造を持つ構文意味解析結果に対応する正解コーパスを効率的に生成することが可能となる。 (もっと読む)


【課題】正確な構文意味解析処理を実行する文書解析システムを提供する。
【解決手段】入力文の係り受け構造に基づいて入力文の分割処理を実行して分割文および分割文によって生成される結合文の構文意味解析処理を実行し、曖昧性が高い結合文については結合以前の分割文対応の構文意味解析結果、曖昧性が低い結合文については結合文対応の構文意味解析結果を結合して、入力文に対応する構文意味解析結果を生成する。本構成により曖昧性の高い長文などであっても、分割文を生成して構文意味解析を行なうことで、正確な構文意味解析処理が実現される。 (もっと読む)


【課題】解を探索する際に最大全域木の探索手法を適用することで、依存構造木として正しい解を得る。
【解決手段】言語解析装置は、入力部11からの入力文に対して、文節単位モデルパラメータと文単位モデルパラメータとによって規定される確率モデルから、依存構造のサンプルを生成する動的サンプル生成部12と、前記生成されたサンプルから、最大全域木探索手法を用いて最適な依存構造を決定する解探索部13と、係り受け関係ラベル決定部14とを有している。係り受け関係ラベル決定部14は、前記決定された依存構造がラベル無し依存構造の場合には、前記ラベル無し依存構造に対して、ラベル付け用モデルパラメータによって規定される確率モデルを用いて、係り受け関係のラベルを同定する。 (もっと読む)


【課題】原因を問うタイプの質問に対する解答の精度を向上させる。
【解決手段】質問応答装置1は、質問文に関連する文書を文書群11から抽出する文書抽出部6と、コーパス12を利用して抽出文書中に含まれる解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す第1スコアを算出する原因文スコア算出部21と、コーパス12から求められた原因結果ペアの共起確率を格納した共起確率テーブル13を利用して、質問文と解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す第2スコアを算出する因果関係表現スコア算出部22と、質問文と解答候補との関連度を表す第3スコアを算出する質問回答関連度算出部23と、第1ないし第3スコアを統合した第4スコアを算出し第4スコアの上位20文を質問文に対する解答として出力する解答候補ランキング部8とを備える。 (もっと読む)


【課題】サーバの負荷状況の変化に伴うサービス品質の劣化を防ぐことのできる係り受け解析システムを提供すること。
【解決手段】係り受け解析サーバ10は、文章データを、通信回線を介して端末装置20から受信し、受信した文章データの係り受けについて、所定の分類器を用いて解析する。更に、係り受け解析サーバ10の負荷を示す負荷データを計測し、分類器の処理速度を調節するためのパラメータに設定するパラメータ値を、計測した負荷データに応じて決定する。 (もっと読む)


【課題】アスキーアートが表す感情を評価することが可能な辞書作成方法を提供する。
【解決手段】顔文字検索ロボット10は、格納装置内のテキストデータから、アスキーアートと、そのアスキーアートと係り受け関係にある感情文字列とを収集する。顔文字検索ロボット10は、その収集したアスキーアートごとに、そのアスキーアートと係り受け関係にある感情文字列を対応付けた顔文字辞書を送信する。顔文字辞書蓄積装置20は、顔文字辞書を受信すると、その顔文字辞書を蓄積する。また、顔文字辞書蓄積装置20は、その顔文字辞書内の顔文字ごとに、その顔文字と対応付けられた感情文字列から評価用文字列を抽出し、その評価用文字列と対応付けられた感情の度合に基づいて、その顔文字が表す感情の度合を評価する。顔文字辞書蓄積装置20は、その感情の度合をその顔文字に対応付けて顔文字辞書に加える。 (もっと読む)


【課題】任意の語句の属性を決定し、決定された属性に従った配信制御をするインターネット上の広告配信方法を実現する。
【解決手段】任意語句及び指定属性語句をインターネット上の情報群を対象に検索し、これら語句の存在する文章において、これら語句の存在箇所の周辺に存在する共起語候補語句を解析して、該共起語候補語句が共起条件を満たしているか否かを判定し、共起条件を満たしている場合には該共起語候補語句がインターネットに公開された日時と指定日時の差分をもとに重み付けをして該共起語候補語句の共起頻度を算出して共起頻度パラメータを有するこれら語句の共起語集合を求め、任意語句の共起語集合に対して、指定属性語句の共起語集合との適合度を計算し、任意語の属性を決定し、決定された属性に従った広告配信制御を行う。 (もっと読む)


【課題】指定された項目およびそれに関連する1つないしは複数個の情報、さらに指定された項目ではないが重要な情報を文書から見つけ出す高機能かつ高精度な情報抽出装置の提供。
【解決手段】記事入力手段10と、テンプレートによる抽出手段20と、係り受け解析による抽出手段30と、記事情報のタグパターンマッチング手段40と、見出しと本文の分割手段50と、見出しの形態素解析手段60と、見出しの助詞除去手段70と、テンプレート又は係り受け解析により抽出された情報と見出し情報とのマッチング手段80と、見出しの特徴情報抽出手段90と、本文の形態素解析手段100と、本文の助詞除去手段110と、見出し特徴情報と本文の文節とのマッチング手段120と、本文の特徴情報の抽出手段130と、見出し特徴情報又は本文特徴情報の売り情報出力手段140とを含む。 (もっと読む)


【課題】処理結果の候補から適切な処理結果を選択する言語処理装置を提供する。
【解決手段】文の構成単位と生起確率とを記憶する第1記憶部121と、係り先および係り元の構成単位で表される係り受け関係と係り先に対して係り元の構成単位が出現する条件付確率とを記憶する第2記憶部122と、処理結果の候補を受付ける入力受付部101と、処理結果の候補の係り受け構造を解析する解析部103と、係り受け構造の候補それぞれについて、文末の構成単位に対応する生起確率を第1記憶部121から取得し、係り受け関係に対応する条件付確率を第2記憶部122から取得し、すべての条件付確率の積と生起確率との積である係り受け構造の候補の生起確率を算出する算出部103aと、算出した生起確率が最大となる係り受け構造の候補を求め、求めた候補に対応する処理結果の候補を選択する選択部104とを備えた。 (もっと読む)


【課題】事前に文法的制約を特化することなく、少数の類似文章対であっても、同義表現を抽出できるようにする。
【解決手段】係り受け解析手段101は、類似文章対の各々の文章に対して係り受け解析を実行する。表現比較手段102は、類似文章対において共通して含まれる表現である共通表現と、同義表現の候補として類似文章対のそれぞれの文章にのみ含まれる表現である相違表現とを抽出する。構造関係特定手段103は、係り受け解析により求められた各文章の木構造における共通表現と相違表現との位置関係を構造関係として特定する。類似性判定手段104は、類似文章対における構造関係の同一性を判定する。さらに、類似性判定手段104は、判定した構造関係の同一性に基づいて、類似文章対における相違表現間の類似度を算出し、類似度の閾値判定処理を行うことによって、同義表現を抽出する。 (もっと読む)


【課題】構文・意味解析結果を高い精度でランキングを行なうことが可能な構文・意味解析ランキングモデルを作成する。
【解決手段】記憶部2で意味情報DB22を予め記憶しておき、意味情報抽出部11Aにより、前記記憶部から読み出した構文・意味解析結果から意味解析結果を抽出し、この意味解析結果に基づいて前記記憶部から読み出した処理対象文から選択した対象語句について、前記記憶部2の意味情報DB22を検索することにより、当該対象語句に関する意味情報を抽出し、素性作成部11Eにより、前記意味情報抽出部11Aで抽出された意味情報に基づいて前記対象語句を展開することにより、構文・意味解析結果ランキングモデル23の作成に用いる素性を作成する。 (もっと読む)


【課題】個々の事例に応じて相互に関係する固有表現の組を抽出可能な装置及びその方法を提供する。
【解決手段】テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出し、抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、固有表現の組に対応する各固有表現が、固有表現の組に対応する各固有表現が他のテキストに共に現れるときの相互情報量を少なくとも含む素性を抽出し、抽出された素性と、所定の固有表現の組に対応する各固有表現間の関係の有無について事前に判別された結果と、該所定の固有表現の組に対応する各固有表現を含むテキストを用いて事前に抽出された事前素性とに基づいて、固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。 (もっと読む)


【課題】個々の事例に応じて相互に関係する固有表現の組を抽出可能な装置及びその方法を提供する。
【解決手段】テキストが入力されると、入力テキストを形態素解析して該入力テキストに含まれる複数の固有表現を抽出した後に、抽出された各固有表現を組み合せてなる複数の固有表現の組毎に、入力テキストに含まれる名詞句を、その名詞句に伴う助詞にそれぞれ対応する領域を有する語句記憶部30に順に記憶するとともに、固有表現の組に対応する各固有表現のうち後方固有表現を含む語句を読み出したときに語句記憶部30における前方固有表現の格納状態を表す情報を取得して、該情報を少なくとも含む素性を抽出し、抽出された素性とモデル記憶部50に記憶されたモデルに基づいて固有表現の組に対応する各固有表現間に関係があるか否かを固有表現の組毎に判別する。 (もっと読む)


121 - 140 / 258