説明

Fターム[5B091AA03]の内容

機械翻訳 (6,566) | 言語 (1,300) | 2言語間 (485)

Fターム[5B091AA03]の下位に属するFターム

Fターム[5B091AA03]に分類される特許

1 - 20 / 170


【課題】大量の文例によることなく、入力される文の文法構造を利用して、平易な文に変換することのできる文変換装置を提供する。
【解決手段】係り受け解析部は、文データを入力し前記文データの係り受け関係を解析し係り受け構造データを出力する。修飾句認定部は、係り受け構造データに基づき文データに含まれる修飾句を抽出するとともに、属性認定用辞書を参照することによって、抽出された修飾句ごとの属性を認定する。対象修飾句判定部は、修飾句認定部によって認定された属性に基づいて、修飾句が変換対象の修飾句か否かを判定する。長さ判定部は、修飾句の長さに応じて変換対象とするか否かを判定する。文変換部は、文変換規則記憶部から読み出した文変換規則に基づいて、変換対象と判定された修飾句を文に変換して出力する。文短縮部は、変換対象とした修飾句に対応して元の文データを短縮する。 (もっと読む)


【課題】第1言語および第2言語で記述されたテキストと、フレーズが第1言語で記述された場合の語の位置と、第2言語で記述された場合の語の位置と、の対応関係を示す情報と、に基づいて、第1テキストの一部の翻訳テキストを決定する情報処理装置を提供する。
【解決手段】情報処理装置100は、第1言語および第2言語のテキストを取得するテキストデータ取得部122と、フレーズが第1言語で記述された場合の語の位置と、フレーズが第2言語で記述された場合の語の位置と、の対応関係を示す情報を取得する文パターン候補検索部124と、テキストを複数のサブテキストに区切る形態素解析部123と、フレーズにおける語の配置と、テキストにおけるサブテキストの配置と、を比較する文パターンマッチング部125と、比較の結果と位置対応情報とに基づいて、翻訳テキストを決定する単語アライメント抽出部129と、を有する。 (もっと読む)


【課題】解析対象となる文書の言語およびドメインを考慮して、その文書に適した解析器を作成する自然言語処理装置を提供する。
【解決手段】自然言語処理装置100は、対訳記憶手段と対訳検索手段と単語抽出手段と正解作成手段と解析器生成手段とを備える。対訳記憶手段は、未知言語の文書と一又は複数の既知言語の文書とからなる複数の対訳文書、およびそのドメインを記憶する。対訳検索手段は、ドメインを指定して、対訳記憶手段から対訳文書を検索する。単語抽出手段は、対訳検索手段で検索された対訳文書から、未知言語の単語と既知言語の単語とを対応付けた単語ペアを抽出する。正解作成手段は、単語ペア、および検索された対訳文書における既知言語の文書の解析結果を用いて、検索された対訳文書における未知言語の文書の解析結果を推定する。解析器生成手段は、未知言語の文書の解析結果を用いて、未知言語の解析器を生成する。 (もっと読む)


【課題】 ランダムウォークの技法を用いて、多数の用語を対象としても妥当な計算量で異言語の単語集合を列挙することが可能な技法を提供すること。
【解決手段】 第1の言語(例えば日本語)の専門用語集合と、第1の言語の一般用語集合と、第2の言語(例えば英語)の専門用語集合と、第2の言語の一般用語集合とを生成する。次に、第1の言語と第2の言語それぞれにおいて、同一言語の専門用語集合と一般用語集合の間に、コーパスの情報に基づきリンクで結び、2部グラフを生成する。次に、異なる言語の一般用語の対訳辞書(例えば、英和辞書)で一般用語間のリンクを生成し、異なる言語の一般用語間で2部グラフを連結する。次に、同一言語内、及び異なる言語間の2部グラフのリンクの重み付けされた情報に基づき、関連度行列Mを生成する。次に、Q=(1-c)(I-cM)-1という、類似度行列Qを計算する。 (もっと読む)


【課題】 要求される言語で記述される情報を含む画像を表わす画像データを、表示部に適切に供給し得る技術を提供する。
【解決手段】 多機能機10は、英語で記述されるウェブページデータが要求される場合に、ROM内の英語文字列テーブルを用いて得られる英語のウェブページデータを、PC300に供給する。多機能機10は、日本語で記述されるウェブページデータが要求される場合に、取得済みの日本語文字列データ用いて得られる日本語のウェブページデータを、PC300に供給する。 (もっと読む)


【課題】従来、正しい用語対訳を自動抽出する場合、学習データや対訳辞書が必要であった。
【解決手段】対訳データベースから1以上の品詞情報パターンに合致する1以上の対訳フレーズを取得する対訳フレーズ取得部と、対訳フレーズ取得部が取得した1以上の対訳フレーズから、第一言語の用語と用語に対応する第二言語の用語の組の候補である1以上の用語対訳候補を取得する用語対訳候補取得部と、2以上の異なる方法により、2以上の各用語対訳候補に対して、スコアを算出し、2以上のスコアを取得するスコア算出部と、2以上のスコアを用いて、2以上の用語対訳候補のうちの一部を選択して蓄積する用語対訳蓄積部とを具備する用語対訳抽出装置により、正しい用語対訳を自動抽出する場合、学習データや対訳辞書が不要である。 (もっと読む)


【課題】
利用者の現在の利用シーンに対応する適応モデルをオンラインで動的に生成する機械翻訳装置を実現することである。
【解決手段】
実施形態の機械翻訳装置は、第1言語を入力する言語入力手段と、前記言語入力手段に入力された第1言語の利用者もしくは利用場所に関する付加情報を取得する付加情報取得手段と、第2言語と当該第2言語を取得した際の利用者もしくは利用場所に関する付加情報を対応付けた第2言語の参照データを格納する参照データ格納手段と、前記付加情報取得手段で取得された第1言語の付加情報の全部あるいは一部と同一な内容の付加情報を有する第2言語のテキスト情報を取得するテキスト情報取得手段と、前記テキスト情報取得手段によって取得された第2言語のテキスト情報を利用して、前記言語入力手段に入力された第1言語を第2言語に翻訳する翻訳手段とを備える。 (もっと読む)


【課題】トレーサビリティマトリクスを容易に作成すること。
【解決手段】抽出部は、文字ファイルに含まれる文字列を相互の関連性に従って解析することで求めた文字ファイルの木構造において、各ノードに配置された文字列から第1の言語で示された所定の文字列群である第1文字列群と第2の言語で示された所定の文字列群である第2文字列群とをそれぞれ抽出する。配置状態算出部は、第1文字列群及び第2文字列群に含まれる文字列それぞれについて、木構造における配置状態から文字列相互の影響度を算出する。類似度算出部は、影響度に基づいて、第1文字列群に含まれる第1文字列に対する第2文字列群に含まれる第2文字列の関連性の高低を示す類似度をそれぞれ算出する。変換部は、文字ファイルにおける第1文字列を類似度が最も高い第2文字列に変換する。 (もっと読む)


【課題】翻訳結果を得るまでの時間を短縮できるとともに、信頼度の高い機械翻訳結果を得ることができる機械翻訳装置を提供する。
【解決手段】言い換え文生成手段81は、入力されたテキスト文と同一の言語でそのテキスト文の内容を示す別の表現へ言い換えた1つまたは複数の言い換え文を生成する。機械翻訳手段82は、言い換え文を翻訳後の言語である目的言語へと機械翻訳する。翻訳信頼度決定手段83は、目的言語へ翻訳された言い換え文の信頼度を示す翻訳信頼度を決定する。言い換え文特定手段84は、言い換え文生成手段81が生成した言い換え文の中から、翻訳信頼度に基づいて言い換え文の候補を抽出し、候補の中から翻訳の対象とする言い換え文である翻訳対象言い換え文を特定する。 (もっと読む)


【課題】
翻訳済に関するデジタル文書情報を提出するに際し、訴訟の証拠資料作成のための作業負荷の軽減を図ることができる。
【解決手段】
デジタル情報を記録部に記録し、記録されたデジタル情報と利用者情報とを表示し、デジタル文書情報に含まれる少なくとも1以上の文書ファイルの指定を受け付け、該指定された文書ファイルをいずれの言語に翻訳するかの指定を受け付け、指定を受け付けた文書ファイルを、記指定を受け付けた言語に翻訳し、記録部に記録されたデジタル文書情報から、指定された文書ファイルと同一の内容を示す共通文書ファイルを抽出し、多言語に対応した全文検索機能を実行する。 (もっと読む)


【課題】異なる言語の一方の文章から他方の文章には含まれない新しい情報を自動的に抽出することにより、共同支援システムにより記述された記事の編集者を支援する。
【解決手段】英語の記事(各文e)及び中国語の記事(各文c)を同一の言語に翻訳し、翻訳後の英語の記事の各文e’と、翻訳後の中国語の記事の各文c’との類似度を、e’とc’との全ての組み合わせについて計算し、各文e’から最大類似度が最小の文からN個の文を抽出して、対応する翻訳前の英語の文に、新しい情報を含む文であることを示すフラグ「+1」を付与する。英語及び中国語の各文をノード、ノード間の関係を類似度に応じた重み付きエッジで表したグラフを作成し、フラグ「+1」の英語の文を表すノードにラベル1、その他に0を付与し、ラベル伝播により付与されたラベルが最大のノードに対応する中国語の文の前または後を、挿入位置として決定する。 (もっと読む)


【課題】本発明は、正解データの作成コストを低減でき、正確性が高い類義性尺度を計算可能なパラメタを学習する類義性尺度用パラメタ学習装置を提供する。
【解決手段】類義性尺度学習装置100は、対訳コーパスを用いて、後記する類義関係単語対一覧および非類義関係単語対一覧を正解データとして作成する正解データ作成装置1と、正解データ作成装置1が作成した類義関係単語対一覧および非類義関係単語対一覧を用いて、単語間の類義性尺度を算出するためのパラメタを学習するパラメタ学習装置3と、パラメタ学習装置3が学習したパラメタを用いて、類義性尺度を計算する類義性尺度計算装置5とを備える。 (もっと読む)


【課題】翻訳漫画の制作にあたり、個々の作業を担当する各ユーザの制作作業の合理化を実現することが可能な翻訳漫画制作支援システム及びそのプログラムを提供する。
【解決手段】翻訳漫画制作支援システムは、クライアント端末と、サーバ装置とを備える。サーバ装置は、記憶手段と、画面情報生成手段と、画面情報送信手段とを備え、原作漫画を構成するページから、作業ページをユーザが選択する画面であって、ページの各々を示すサムネイルを表示するページ選択画面の画面情報を生成し、当該画面情報をクライアント端末に送信する。クライアント端末は、受信手段と、表示手段と、入力手段とを備え、サーバ装置から受信した画面情報に基づきページ選択画面を表示すると共に、ページ選択画面から任意のサムネイルを前記ユーザに選択させる。このとき、ページ選択画面に表示される各サムネイルは、ユーザが担う作業の進捗状態に応じて、表示態様が異なる。 (もっと読む)


【課題】入力に対する尤もらしい上位N個の変換結果を、任意に設定した複数の素性に基づきスコアリングやリランキングする際に、当該複数の素性の中に疎な素性が含まれていても精度の高いスコアリングやリランキングを行うことを可能とする。
【解決手段】複数の学習用データを用い、任意に設定した複数の素性それぞれに対する重みを学習用データごとに別々のタスクとしてマルチタスク学習法により学習し、その重みの値を指標として、当該複数の素性のうち各学習用データに共通して作用している素性を抽出し、この抽出した素性に絞り込んで素性重みを学習してスコアリングやリランキングを実行する。 (もっと読む)


【課題】翻訳精度を向上させつつ、リアルタイム性の高い翻訳処理を実行できる翻訳装置、翻訳方法及びコンピュータプログラムを提供する。
【解決手段】翻訳単位抽出部11は、入力された文字列を所定の翻訳単位に分割し、翻訳単位毎に文字列を抽出する。翻訳単位抽出部11は、ユーザからの指示に従って、それぞれ前後する翻訳単位において、前側の翻訳単位に含まれる文字列中の末尾から所定数の単語を、後側の翻訳単位の先頭に付加して抽出するオーバラップ処理を行なう。翻訳部12は、翻訳単位抽出部11によってそれぞれ抽出された各翻訳単位の文字列を翻訳する。表示制御部13は、表示中の文字列の先頭から順に、翻訳部12による翻訳結果を対応付けて表示させる。また、表示制御部13は、ユーザからの指示に従って、オーバラップ処理によって後側の翻訳単位に付加された、前側の翻訳単位の単語の翻訳結果を、後側の翻訳単位の翻訳結果として表示させる。 (もっと読む)


【課題】複数のソース言語単語セグメント化方式をSMTデコード処理に統合して翻訳の品質を高める、単語セグメント化システム及び単語セグメント化方法を提供する。
【解決手段】句テーブル生成器10は、翻訳対のバイリンガルコーパス32及び34を記憶する記憶部30を含む。翻訳対の各々は第1の言語34のソース文と、第2の言語32のターゲット文とを含む。生成器はさらに、コーパスを利用して統計的機械翻訳機(SMT)をトレーニングする分類器トレーニング装置12を含む。SMTはトレーニングの間に句テーブル16を出力する。生成器10はさらに、複数の句テーブル16を統合された句テーブル20に統合するための句テーブルマージ部18を含む。 (もっと読む)


【課題】第1自然言語(日本語)の文章の中で省略されている用語を適切に補完して、第2自然言語(英語)に翻訳しやすいような第1自然言語(日本語)の文章を作成する。
【解決手段】ユーザ端末10から日本語による情報を入力すると、情報記録手段20が、ユーザ端末10によって入力された日本語による入力情報を記録する。そして、解析手段40が、情報記録手段20に記録されている入力情報を抽出して形態素解析を行い、用語と品詞との関係を示す修飾要素と情報記録手段20ごとに記録された入力情報とに基づいて専用辞書を作成する。そして、解析手段40は、形態素解析によって得られた第1の情報と専用辞書に記録されている第2の情報とを比較し、ユーザ端末10から入力された日本語による文章に対して付与可能な修飾要素を検出し、検出された付与可能な修飾要素に基づいて、日本語による文章の中で省略されている用語を補完する。 (もっと読む)


【課題】翻訳結果の音声を聴取者に好適に提示することができる翻訳音声再生装置およびその再生方法を提供する。
【解決手段】第一の言語および第一の言語とは異なる第二の言語に係る音声の入力を受け付ける音声入力部16と、入力された第一の言語に係る音声を音声認識した後に第二の言語に翻訳し第二の言語に係る音声データを生成し、および入力された第二の言語に係る音声を音声認識した後に第一の言語に翻訳し第一の言語に係る音声データを生成する翻訳処理部29と、特定の方向へ音声データを出力する第一の音声出力部15と、第一の音声出力部よりも無指向に音声データを出力する第二の音声出力部17と、第一の言語に係る音声データを第一の音声出力部15より出力させ、第二の言語に係る音声データを第二の音声出力部17より出力させる再生方向切替部29とを備えた。 (もっと読む)


【課題】言語学的に導かれた単語の分離ツールが不要な文分離器トレーニング装置を提供する。
【解決手段】文分離器は、文字ベースの分離器、バイリンガルコーパスを利用してSMTをトレーニングする第1のトレーナ、SMTの評価器、SMTによる対応付け結果を用い第2の分離器をトレーニングする第2のトレーナ、第2のトレーナによりトレーニングされた第2の分離器を利用してソース文をセグメント化するセグメント化装置、第1及び第2のトレーナ、評価器、並びに第2の分離器を、性能が悪くなるまで繰返し動作させる制御器、最初は第1の分離器によってセグメント化されたコーパスを、以降の繰返しでは第2の分離器によりセグメント化されたコーパスを選択してレーニングコーパスとして第1のトレーナに与える選択器とを含む。 (もっと読む)


【課題】翻訳対象原文と翻訳用例原文との差分が翻訳用例訳文に含まれない合成語の場合であっても訳文中の対応する訳語の範囲を確定することである。
【解決手段】入力装置20から入力された翻訳対象の第1言語の文章データを1文単位に分割して翻訳対象原文を求め、翻訳用例検索部30は翻訳対象原文に対して翻訳用例データベース36から翻訳用例原文と翻訳用例訳文との対の翻訳用例を検索し、差分対応付け部31は類似用例原文と翻訳対象原文との差分に対応する類似用例訳文中の語句と翻訳対象原文中の語句とを対応付け、その1対1の対応付けに失敗した語句に対して再対応付け可能判定部32によりそれぞれの語句の範囲を拡大して再度対応付けを行い、これらによって対応付けられた翻訳対象原文中の差分の語句の訳語を取得し、訳語置換部34は対応付けられた類似用例訳文中の語句を、取得した訳語に置き換えて訳文を生成する。 (もっと読む)


1 - 20 / 170