説明

国際特許分類[G06F17/28]の内容

国際特許分類[G06F17/28]に分類される特許

901 - 910 / 1,147


コロケーション翻訳を抽出するシステムおよび方法を提示する。本方法には、ソース言語およびターゲット言語のモノリンガルコーポラおよびバイリンガルコーパス(使用可能な場合)を使用してコロケーション翻訳モデルを構築するステップが含まれる。コロケーション翻訳モデルは、コロケーションの前後のコンテキストワード(contextual words)に関する期待値最大化(EM:expectation maximization)アルゴリズムを使用する。コロケーション翻訳モデルは、後でコロケーション翻訳辞書を抽出するために使用できる。コンテキストの冗長性(context redundancy)および/または双方向翻訳の制約(bi−directional translation)に基づくオプションのフィルタを使用して、信頼性の高いコロケーション翻訳のみが辞書に組み込まれることを保証できる。構築されたコロケーション翻訳モデルと抽出されたコロケーション翻訳辞書は、後でセンテンス翻訳(sentence translation)などのさらなる自然言語処理(natural language processing)を行う場合に利用できる。
(もっと読む)


【課題】 教材を用いた外国語学習において、学習者が辞書を引く手間を省き、学習者の学習効率を向上させることのできる技術を提供する。
【解決手段】 複合機1の制御部11は、単語翻訳指示が入力されたことを検知すると、画像読取部13を制御して入力原稿の画像を光学的に読み取らせ、原稿の内容を表す画像データを生成する。続けて、制御部11は、画像データに対して所定の文字認識処理を行ってテキストデータを生成するとともに、テキストデータの文字の区切りを認識して単語を特定する。そして、複合機1の制御部11は、それぞれの単語の難易度と翻訳レベルとをそれぞれ比較することによって、単語の発音記号や翻訳単語等の付加情報を付与するか否かを判定し、付加情報を付与すると判定された単語に対して付加情報を付与し、画像形成部14を制御して印刷出力させる。 (もっと読む)


【課題】 体験情報を取得する際に、今まで体験表現のみでの抽出することよりもさらに、情報の鮮度や頻度などの状況がわかり、体験情報判定制度を向上させる。
【解決手段】 本発明は、物事を利用もしくは、体験・経験したことを表すような語句である体験表現が格納されている体験表現記憶手段を参照して、入力されたテキスト中に、体験表現が記述されているか否かを判定し、体験そのものが行われた時間や頻度を示す時間情報が格納されている時間情報記憶手段を参照して、入力されたテキスト中に時間情報が記述されているか否かを判定し、体験表現と時間情報の両者が存在するとき、入力されたテキストが体験情報であるかを判定する。 (もっと読む)


【課題】 良好に翻訳できない部分があった場合でも、解釈に誤解を与えることがない翻訳文を作成できる翻訳装置および翻訳方法を提供する。
【解決手段】 翻訳対象である原文を翻訳して翻訳文を作成する翻訳部15と、翻訳部15による翻訳の精度を検出する翻訳精度検出部18と、表示を行うプリンタ26と、プリンタ26を制御する表示様態制御部25とを有し、表示様態制御部25は、プリンタ26によって、原文と翻訳文とを比較可能に表示させるとともに、翻訳文の翻訳精度検出部18で検出された精度が低い場合には、精度低下の原因部分は原文のまま強調して表示を行わせる。 (もっと読む)


【課題】二つの文の意味的等価性を信頼性高く評価できる装置を提供する。
【解決手段】意味的等価性評価装置は、二つの文の単語の各々に適切なPOSタグを付し、第1及び第2の単語の集合98、100を出力するPOSタグ付け及びステム処理部96と、第2の単語の集合100に対する第1の単語の集合98の拡張PERスコアを計算するためのPER計算モジュール102とを含む。拡張PERスコアは第1及び第2の単語の集合98、100の一致しない単語から計算された第1の要素グループと、第1及び第2の単語の集合98、100の一致した単語から計算された第2の要素グループとを含む。 (もっと読む)


【課題】 質問応答システムにおいて、質問に対して最適な回答を提供可能とした構成を実現する。
【解決手段】 入力質問の検索結果に対する照応解析結果に基づいて、検索結果に含まれる名詞句、代名詞およびゼロ代名詞のいずれかの表現を整理し、参照関係にある表現を共有する文を参照関係文として抽出し、回答候補抽出パッセージの選択処理において、選択パッセージに対応する参照関係文を含めて回答候補抽出パッセージとして設定し、これらのパッセージから回答候補を抽出する。本構成により、検索キーワードとのマッチ度に基づくパッセージ選択を行なった場合に、キーワードから離間した位置にある有力な回答候補を見落とすことなく、確実に回答候補として取得し、クライアントに提示することが可能となる。 (もっと読む)


【課題】 ユーザ固有の関連語辞書の生成、更新処理を効率的に実行可能とした構成を実現する。
【解決手段】 質問応答システムにおいてユーザの質問から重要語として抽出されたキーワードと、キーワードに基づく検索処理の結果から抽出された回答候補と回答候補の適正情報を、関連語辞書修正手段に入力し、これらの入力情報に基づいて関連語辞書の修正処理を実行する。例えば、回答候補の適正情報に基づいて、キーワードと適正な回答各々に対応する語相互の関連度を上昇させ、キーワードと不適正な回答各々に対応する語相互の関連度を低下させる処理などを実行する。このような関連語辞書修正処理により、質問応答システムを利用したユーザの興味、関心分野に特化したユーザ固有の関連語辞書が生成または更新される。 (もっと読む)


【課題】 翻訳手段の性能特性による影響を排除或いは低減させて、異なる言語で記述された検索条件から文書検索を行うよう多言語文書検索を精度良く行う。
【解決手段】 第1言語の検索条件を入力手段4から入力し、各翻訳装置1a、1b、1cが検索対象文書と同じ第2言語にそれぞれ翻訳し、統合化手段2が翻訳された3つの翻訳結果(検索条件)の語ベクトルを求め、これら3つの語ベクトルを1つの語ベクトルに統合化する。検索対象の各文書には予め語ベクトルが付加されており、検索手段3が統合化された検索条件の語ベクトルと対象文書語ベクトルとが所定の類似関係にあることに基づいて該当する文書を検索結果として出力手段5から出力する。 (もっと読む)


【課題】訳例データベースの類似検索結果から翻訳対象文中の様々な表現について最適な訳例の絞込みが適切できるようにする。
【解決手段】訳例データベースから翻訳対象文に類似する訳例を検索し、類似検索の検索結果に基づき、翻訳対象文を構成する単語及び部分文字列の一致部分を含む訳例検索数を濃淡、色などで段階的に強調することで定量的に表示し、訳例を利用する単語や部分文字列を絞り込む。訳例検索数の定量表示が行われた翻訳対象文の単語を選択すると、選択単語の訳例が表示される。また単語選択に対応して、選択した単語を含み且つ訳例をもつ複数の部分文字列のリストが表示され、リスト中の部分文字列を選択することで、それを含む訳例が表示される。
(もっと読む)


【課題】日本語文書等における誤りを指摘する文書校正装置およびプログラム記憶媒体に関し,文書中の誤り箇所の過剰指摘を防止し,ユーザの判断を軽減させて,校正作業効率を向上させることを目的とする。
【解決手段】複数の誤り確率計算部2a,2b,…は,それぞれ異なる誤り確率計算手法により誤り確率値を計算する。誤り確率保存部3はこれらの誤り確率値を集計し,原テキストの各文字または文字列に対して,集計した誤り確率値を付与する。誤り候補抽出部5は所定の誤り確率閾値4を超える誤り確率値を持つ文字または文字列を誤り候補として抽出する。誤り表示処理部6は,抽出された誤り候補を校正用のテキスト中に下線付き表示または色違い表示等により表示する。 (もっと読む)


901 - 910 / 1,147