説明

Fターム[5B091AB08]の内容

機械翻訳 (6,566) | 処理対象要素 (373) | 学術用語、技術用語 (12)

Fターム[5B091AB08]に分類される特許

1 - 12 / 12


【課題】さらに複雑なものであっても共通に認識しうる絵文字を用いた多言語間意思疎通支援装置及びシステムを提供する。
【解決手段】このシステム1は、言語の異なる者へ、絵文字を用いて意思疎通を図ることを支援するものであって、ある言語が入力部24から入力されると、複数の絵文字の候補をその最有力候補が識別可能となるように表示部23に表示する表示手段211と、それらの候補の中から1つの候補が選択されると、この選択された候補が前記最有力候補と入れ替わる入替手段212とを備えている。 (もっと読む)


【課題】該当する専門分野の用語に統一を図った訳文を生成することである。
【解決手段】翻訳辞書部の翻訳辞書情報及び専門用語辞書部の対訳情報を用いて第一言語文書の形態素解析を行い形態素の属性情報及び訳語情報を解析情報として求め、訳語情報に基づき訳文を生成する。その際、専門用語辞書の見出し語が使われて構文解析に失敗したときはその見出しを棄却して訳文を得る。専門用語辞書の見出し語の棄却により訳文を得たときは、単語単位に分割した第一言語の見出し語の訳語候補のいずれかが単語単位に分割した見出し語の訳語に一致しているかどうかを判定し、一致しているものがあるときは、文書解析手段で得られた訳文中のその見出し語の訳語に相当する部分をその訳語候補に置き換える。 (もっと読む)


【課題】単語カテゴリの用語辞書を構築する場合に、新規追加されたテキストから、登録すべき単語を漏れなく見つけ、且つ作業を効率的に行う。
【解決手段】テキスト・データの形態素解析を行い、トークン列データを取得する形態素解析部と、上記トークン列データの各トークンをカテゴリ辞書を用いて判別し、未カテゴリ語を抽出するカテゴリ判別部と、抽出した未カテゴリ語を未カテゴリ語照合ルールと照合し、該未カテゴリ語照合ルールに合致する未カテゴリ語を登録候補語として抽出する未カテゴリ語照合部と、上記未カテゴリ照合部と、上記トークン列データのトークン列をトークン列照合ルールと照合し、該トークン列照合ルールに合致するトークン列を登録候補語として抽出するトークン列照合部とを含み、上記カテゴリ辞書に上記登録候補語を登録するかどうかの選択をユーザに許す許可部とで構成されるコンピュータシステム。 (もっと読む)


【課題】専門用語からの精度の高い用語(形態素)抽出を実現する。
【解決手段】例えば医療分野などの専門分野における用語、例えば形態素としての用語抽出を行なう構成において、用語の長さに依存した評価を行い、長さ重視の用語候補抽出処理を実行し、文書データベースの格納文書を検索し、抽出した用語候補と同じ用語の出現回数をカウントし、出現回数に応じた用語の複製を含む用語テキストを生成して、生成した用語テキストを解析対象として、第一用語抽出手段の抽出した用語候補の出現頻度に依存した評価を行い、出現頻度の高い用語候補を出力用語として選択する。本構成によりノイズ成分の少ない形態素として最適な専門用語の抽出を効率的に行なうことが可能となる。 (もっと読む)


【課題】Webドキュメントから専門用語を自動的に抽出する専門用語抽出装置を提供すること。
【解決手段】本装置のクロール部が、専門分野ごとのURLリストを用いて、Webページのコンテンツを収集する。URLリストは、常にUp−To−Dateに更新する。次に、本装置の単語抽出部によって、収集されたWebページのコンテンツのテキストを形態素解析し品詞に分類して、カタカナ語彙と全字種の語彙を抽出する。この際、助詞や接続詞など専門用語になりにくい品詞は抽出対象から除外する。そして、本装置のカタカナ用語抽出部によって、抽出されたカタカナ語彙に対して、FLR法を用いて、重要度の計算を行い重要度の高いカタカナ用語を抽出する。さらに、専門用語抽出部によって、カタカナ用語と、先に抽出された全字種の語彙との共起ヒット情報を計算して、専門用語を抽出する。 (もっと読む)


【課題】信頼性の高い専門用語の抽出ルールを得ることが可能な専門用語抽出ルール取得システム、専門用語抽出ルール取得処理方法及び専門用語抽出ルール取得プログラムを提供するものである。
【解決手段】
PC100は,第1言語の専門用語辞書に登録された専門用語と、第1言語の文書とに基づいて、第1言語の専門用語抽出ルールの候補を生成する第1言語抽出ルール候補生成部30と、第1言語と第2言語の対訳辞書に基づいて、第1言語の専門用語抽出ルール候補を第2言語の専門用語抽出ルール候補に翻訳する抽出ルール候補翻訳部50と、第2言語の専門用語辞書に登録された専門用語と、第2言語の文書とに基づいて、第2言語の専門用語抽出ルール候補のいずれかに対応する第1言語の専門用語抽出ルール候補を、第1言語の専門用語抽出ルールとして特定する抽出ルール特定部80とを有する。 (もっと読む)


【課題】従来の用語収集装置においては、時事的な用語などを収集できなかった、という課題があった。
【解決手段】1以上の関連文書から用語を取り出す用語取得部と、用語取得部が取得した1以上の用語のうちの各用語について、1以上の関連文書内での出現頻度である関連文書中出現頻度を取得する関連文書中出現頻度取得部と、用語取得部が取得した1以上の用語のうちの各用語について、1以上の関連文書または1以上の非関連文書内での出現頻度である文書中出現頻度を取得する文書中出現頻度取得部と、用語取得部が取得した1以上の用語のうちの各用語について、関連文書中出現頻度、および文書中出現頻度を用いて、用語の専門性または特殊性に関するスコアを算出するスコア算出部と、スコア算出部が算出したスコアに基づいて用語を出力する出力部を具備する用語収集装置により、時事的な用語などを収集できる。 (もっと読む)


【課題】従来の用語抽出装置において、同時翻訳に有用な用語を抽出できない、と言う課題があった。
【解決手段】用語収集の元になる情報である元情報を受け付ける元情報受付部と、元情報と、格納している2以上の各情報群との関連度である情報関連度を、情報群ごとに算出する情報関連度算出部と、2以上の情報群から1以上の用語を抽出する用語抽出部と、用語抽出部が抽出した1以上の各用語の、2以上の情報群における出現頻度と情報関連度に関する情報である出現頻度情報を用語ごとに取得する出現頻度情報取得部と、用語抽出部が抽出した1以上の各用語の、特殊性に関する情報である特殊性情報を用語ごとに取得する特殊性情報取得部と、出現頻度情報および特殊性情報に基づいて、用語抽出部が抽出した用語のうち、1以上の用語を出力する出力部を具備する用語抽出装置により、同時翻訳に有用な用語を抽出できる。 (もっと読む)


【課題】ウェブ検索技術及びデータマイニング技術を用いて語句の目的言語における正確な訳を得ること。
【解決手段】語句を入力する入力装置と、語句が入力された後に回答される電子文書及びウェブページによって候補訳を設定し、候補訳の境界を見出し、候補訳の特性をカウンティングする候補訳カウンティング装置と、候補訳のカウンティング装置によって生成されたノイズを識別して処理する候補訳ノイズ処理装置と、候補訳のカウンティング装置から取得した候補訳の特性によってすべてのあり得る候補訳を評価して順位付けする候補訳評価装置と、候補訳の典型的な例示文章をウェブ上でマイニングし、これを典型性の程度によって順位付けする候補訳典型例示文章マイニング装置と、他の言語で重み値に応じた順に配列された語句の候補訳リスト及び典型的な例示文章を出力する出力装置と、を備える。 (もっと読む)


【課題】表記語を代表語に対応付けた辞書の妥当性を評価する。
【解決手段】テキストに表記された表記語を変換する辞書の妥当性を評価する装置であって、少なくとも1つの表記語を、当該少なくとも1つの表記語を代表する代表語に対応付けて、語句のカテゴリー毎に記録している辞書記録部と、一のカテゴリーの代表語が他のカテゴリーの表記語と一致し得ることを条件に、当該一のカテゴリーが当該他のカテゴリーに依存する依存関係を記録している関係記録部と、辞書記録部において第1のカテゴリーの代表語が第2のカテゴリーの表記語と一致し、かつ、第1のカテゴリーが第2のカテゴリーに依存する依存関係が関係記録部に記録されていないことを条件に、当該表記語が、当該代表語により代表される語句として妥当でないと評価する評価部とを備える装置を提供する。 (もっと読む)


【課題】複数の翻訳辞書を用いて機械翻訳する際に各辞書由来の尤度の偏りを補正して精度の高い翻訳処理を可能とすること。
【解決手段】固有表現抽出手段11で入力文に含まれる固有表現を抽出して固有表現抽出済み文を作成し、句対訳候補列挙手段25で固有表現抽出済み文を構成する各々の句に対応する句対訳候補を翻訳モデル群記憶部21から検索し、その確率値とともに対訳侯補テーブル24に記録し、辞書別重み付け手段26で重み付けテーブル23を参照して句対訳候補に対応する各翻訳辞書由来の確率値に重みを付け、最適経路探索手段27で対訳侯補テーブル24に記録された句対訳候補による組み合わせのうち、重みを付けられたそれぞれの確率値と、言語モデル記憶部22から取得した当該組み合わせにおける連続する2つの単語の確率値との積が最大となる組み合わせを求めて翻訳結果として出力する。 (もっと読む)


【課題】クレーム文を図式化表示し、クレーム文の中の技術要素を抽出し、技術要素どうしの関係を図式化表示の中で明確に表示し、クレーム文として再検討すべきことを出力する特許明細書デバッグツール。
【解決手段】入力した日本語のクレーム文をクレーム文解析用の形態素辞書を用い形態素解析して、格助詞「と」に前置される技術要素と「前記」などの指示語に後置される語句から特定される技術要素とを抽出し、発明を特定する要素である主題とその主題に直接関係する技術要素との木構造を作成し、技術要素どうしの関係を木構造の上で図式化表示して技術要素どうしの関係を明確に理解できるようにし、クレーム文の中の技術要素の上位概念の語句を検出出力し、上位概念語句の使い方と、文法上の問題点と、技術要素の使い方での問題点を出力して、クレーム文の再検討を容易にできるようにする。。 (もっと読む)


1 - 12 / 12