説明

Fターム[5B091BA19]の内容

機械翻訳 (6,566) | 翻訳方式 (609) | 自然言語理解(処理)方式 (19)

Fターム[5B091BA19]に分類される特許

1 - 19 / 19


【課題】 ブログやチャット等の短い文書の文書解析における曖昧性を解消する。
【解決手段】 本発明は、テキスト及び時刻を含む文書情報とユーザ情報を取得し、該文書情報を文書情報記憶手段に格納し、ユーザ情報に基づいてマイクロブログサービスから関係ユーザ情報を取得し、関係ユーザ情報に基づいてマイクロブログサービスから文書情報の時刻の任意の期間範囲の関係文書情報を取得して、文書情報記憶手段に格納し、文書情報記憶手段に格納されている文書情報と関係文書情報を時刻順にソートして1文として結合した解析対象文書を生成する。その上で解析対象文書を解析する。 (もっと読む)


【課題】構文的にわかりにくい文を自動的に検出し、ユーザに対して提示することが可能な文書処理装置およびプログラムを提供することにある。
【解決手段】ルール格納手段は、構文的にわかりにくい文を検出するための予め定められた条件および当該条件に応じたメッセージを対応づけて格納する。入力手段は、ユーザによって指定された文を入力する。解析手段は、入力手段によって入力された文の構造を解析する。判定手段は、解析手段による解析結果に基づいて、入力手段によって入力された文がルール格納手段に格納されている条件を満たすかを判定する。出力手段は、条件を満たすと判定手段によって判定された場合、入力手段によって入力された文の構造および当該条件に対応づけてルール格納手段に格納されている当該条件に応じたメッセージを出力する。 (もっと読む)


【課題】変換対象の単語を修飾する修飾句をも考慮しながら、名詞から動詞等へ、異なる品詞間での単語変換を行うことによって、自動的に文を平易化する。
【解決手段】平易化規則選択部は、係り受け解析結果データに含まれる名詞データに基づき、平易化規則テーブル記憶部から適用可能な前記平易化規則データを選択する。修飾句変換規則選択部は、平易化規則データが適用され得る名詞データを修飾する連体修飾句データを抽出し、修飾句変換規則データを選択する。格フレーム照合部は、平易化規則データに含まれる用言データと、選択された修飾句変換規則データに含まれる連用修飾句データとに基づき、格フレームテーブル記憶部から出現頻度データを読み出し、出現頻度に基づいて表現の置換を行う。体言変換規則選択部は、自立語に合う体言化データを選択し、用言データを体言化する。 (もっと読む)


【課題】各種システムやソフトウェアに対する顧客からの要求をより確実に獲得することができる要求獲得支援装置を提供する。
【解決手段】要求獲得支援装置として、ヒアリング案件に関する要求関連文書データを入力する情報登録手段と、要求関連文書データ文章中の多義的に捉えられ得る曖昧ポイントを抽出し、抽出した個々の曖昧ポイントについて曖昧性の特徴に基づく曖昧性の種類を示す曖昧性分類を決定する要求関連文章分析手段と、要求関連文書データの曖昧性をヒアリング実施者の立場から定量化して要件把握性として定義する要件把握性評価手段と、要求関連文書データにおける個々の曖昧ポイントについて、曖昧性分類と要件把握性に基づき分析して、質問に適したヒアリング時に提供するヒアリングアドバイスを候補から選択するヒアリングアドバイス分析手段と、選択されたヒアリングアドバイスを表示するヒアリングアドバイス表示手段とを設ける。 (もっと読む)


【課題】 目的語と述語が離れている文の検出精度を向上させる。
【解決手段】 実施形態の言語解析手段は、前記入力を受け付けた文を言語解析し、言語解析結果を得る。実施形態の抽出手段は、前記言語解析結果から前記文の目的語と述語を抽出する。実施形態の距離診断手段は、前記抽出された目的語と述語との前記文内での距離が予め設定された基準よりも大きいか否かを診断する。実施形態の述語省略診断手段は、前記距離診断手段による診断の結果、距離が大きい場合、前記抽出された目的語と前記言語解析手段による言語解析結果と前記述語省略診断ルールとに基づいて、当該目的語に対して述語が省略されている場合に該当するか否かを診断する。実施形態の第1の指摘情報生成手段は、前記述語省略診断手段による診断の結果、該当しない場合、前記目的語と前記述語とが離れている旨の指摘情報を生成し、この指摘情報を出力する。 (もっと読む)


【課題】日本語辞書,日英対訳辞書を要することなく、単語の意味属性を自動で推定する。
【解決手段】意味属性推定装置5は、予め概念ベクトルと意味属性が付与された多数の既存単語の情報を格納した概念ベース4を備える。そして、概念ベクトル付与手段1は意味属性を推定したい単語(処理対象単語)に対して概念ベクトルを算出する。距離計算手段2は、処理対象単語と、予め概念ベース4に格納された既存単語との概念ベクトルにおける距離を算出する。意味属性候補出力手段3は、前記概念ベクトルにおける距離に基づき、処理対象単語の概念ベクトルとの距離が小さな単語を抽出し、抽出された単語の意味属性を処理対象単語の意味属性候補とする。 (もっと読む)


【課題】口語的な「くだけた表現」を含む文章情報であっても、未知語と判断されることのない、文章解析に適した文章に修正する文章修正プログラム等を提供する。
【解決手段】修正基準文章情報の集合を記憶した基準文章記憶手段と、基準文章記憶手段を用いて、解析対象文章情報の内容に類似する1つ以上の修正基準文章情報を検索する基準文章検索手段と、解析対象文章情報を形態素に分割し、未知語を抽出する未知語抽出手段と、未知語と、当該未知語に対する前方及び後方の少なくとも一方の隣接形態素とからなる検索キーを生成する検索キー生成手段と、修正基準文章情報の中から、検索キーを用いて、未知語に近似する1つ以上の修正ルールを検索する修正ルール検索手段と、修正ルールの中から、文章構成指標に基づいて1つの修正ルールを選択する修正ルール選択手段とを有する。 (もっと読む)


【課題】文脈に関して翻訳メモリ内の複数のソーステキストとのテキストルックアップセグメントのマッチングレベルを判定する方法を提供すること。
【解決手段】本発明は、複数のソーステキスト内のルックアップセグメントに関するすべての正確一致を判定し、少なくとも1つの正確一致が判定される場合に、ルックアップセグメントの文脈がそれぞれの正確一致の文脈と一致する場合に、それぞれの正確一致がルックアップセグメントの文脈内正確一致であると判定する。必要な文脈マッチングの度合は、事前に決定することができ、結果に優先順位を付けることができる。本発明は、文脈を含めて、翻訳メモリにソーステキスト及びターゲットテキストの翻訳対を格納する方法、システム、及びプログラム製品、並びにそのように形成された翻訳メモリをも含む。内容が、以前に翻訳された内容と同一に翻訳され、翻訳者介入を減らす。 (もっと読む)


【課題】従来と同等な推定精度を確保しつつ汎用の計算機でモデルパラメータの推定処理を可能とする。
【解決手段】それぞれ重要度ei,jが割り当てられ素性ベクトルで表現された複数のシンボル系列fi,jからなる1以上のリストiと各リストiの正解シンボル系列fi,0とが入力され、モデルパラメータを推定する装置であり、グルーピング部とマージング部とモデルパラメータ推定部とを備える。グルーピング部はリストに属する複数のシンボル系列fi,jを複数のグループに分ける。マージング部はグループ内の複数のシンボル系列fi,jから代表シンボル系列fi,xを、グループ内の複数のシンボル系列fi,jに対応する複数の重要度ei,jから代表重要度ei,xをそれぞれ求める。モデルパラメータ推定部は代表シンボル系列fi,xと正解シンボル系列fi,0と代表重要度ei,xとからモデルパラメータを推定する。 (もっと読む)


【課題】
辞書の生成及び共起コンテキストの決定を行うためのシステム及び方法を提供する。
【解決手段】
一実施形態によれば、辞書を生成し且つ共起コンテキストを決定することは、複数の記事を有するドメインコーパスにアクセスすることを含む。各記事は、特定のトピックに該当し、1つ以上の他のトピックに該当する1つ以上の他の記事にリンクする1つ以上のタームを有する。各トピックは、辞書を生成するためのタームとして指定される。共起コンテキスト内に出現する少なくとも2つのタームは、共起していると見なされる。共起コンテキストに従って、ターム間の共起が計算される。 (もっと読む)


本開示は、既存の技術において、最適な単語列を選択する時に、非常に大きな計算負荷を有する問題を解決するため、単語境界のない言語で記述されたテキストに対して単語列を選択するための方法および装置を開示する。開示される方法は、異なる単語列を取得するために、テキストのセグメントを分割することと、該単語列に対して共通の単語境界を判定することと、共通の単語境界の前に該単語列の部分に対して、最適な単語列の選択を実施することと、を含む。最適な単語列の選択は、共通の単語境界の前にある単語列の部分に対して実施されるため、より短い独立単位を取得することができ、従って、単語分割の計算負荷を低減することができる。
(もっと読む)


信頼勾配が組み込まれた既存領域概念から形式概念解析およびファセット分類統合などの異なった意味処理プロトコルを活用し、データの一領域からの概念定義および概念関係の統合のためのコンピュータによるシステムおよび方法。認識または入力エージェントはアクティブ概念の入力を備え、既存の領域概念と照合する。その結果として得られた関連した領域概念の集合は、意味処理プロトコルによって仮想概念定義を導出するために使用される。その導出されたものは、属性集合内における、属性の他の属性からの相対近接性の概念によりオーバーレイされる。その相対近接性の尺度によって、更なる一貫性の層が備えられる。最終的に、木構造の、関連する仮想概念定義の集団が結果として得られる。
(もっと読む)


【課題】電子メールやWeb掲示板などのやり取りの際に含まれる引用記号を利用して、同一内容の文書が文の出現順に左右されずに翻訳精度を向上させることである。
【解決手段】文書階層判定部30は、第一言語文書の文の先頭に引用記号が存在するか否かを判定し、引用記号が存在するときは文の先頭からの引用記号の個数を引用形式の階層と判定し、引用形式の階層ごとに第一言語文書の文を文書記憶部32に格納する。翻訳部29は、文書記憶部32に格納された文のうち引用形式の階層が深い順に、翻訳知識情報格納部33に格納された翻訳知識情報を利用して翻訳を行い、その翻訳の際に使用した翻訳辞書の語彙部や変換規則から訳語を選択するに有用な翻訳知識情報を取り出し翻訳知識情報格納部33に格納する。出力部28は、翻訳部29で翻訳された翻訳結果を出力装置17に出力する。 (もっと読む)


【課題】大量の学習データや複雑なルールを用いずに、比較的容易に構築可能でかつ頑健さも兼ね備えた言語理解装置を提供する。
【解決手段】言語理解モデル記憶部(10)は、単語遷移のデータとコンセプト重みデータとを記憶する。有限状態変換器処理部(20)は、入力される単語系列に含まれる単語に基づき、単語遷移のデータに従って、定義された出力を理解結果候補として出力し、単語重み値を累積する。コンセプト重み付け処理部(30)は、コンセプト重みデータに従って、理解結果候補に含まれるコンセプトに対応するコンセプト重み値を累積する。理解結果決定部(40)は、出力された複数の系列の理解結果候補の中から、累積された単語重み値と累積されたコンセプト重み値とに基づき理解結果を決定する。 (もっと読む)


【課題】辞書に登録されていない複合語を検出する。
【解決手段】複合語処理規則の例の最初の規則では、表記の規定がない名詞と表記が「株式会社」である単語との2つの単語が隣接する場合は、双方を結合して品詞を固有名詞とするルールが記述されている。そして、2つ目の規則では、表記の規定がない名詞と表記が「社長」である単語との2つの単語が隣接する場合は、双方を結合して品詞を固有名詞とするルールが記述されている。そして、3つ目の規則では、表記の規定がない名詞と表記が「一塁手」である単語との2つの単語が隣接する場合は、双方を結合して品詞を固有名詞とするルールが記述されている。複合語処理部は、形態素解析部の制御に基づいて、形態素解析情報を取得し、複合語処理規則データベースに登録されている複合語処理規則を参照して、形態素解析情報を複合語解析情報に変換する。本発明は、パーソナルコンピュータに適用できる。 (もっと読む)


【課題】健聴者及び聴覚障害者の双方が情報内容を簡単かつ迅速にしかも正確に把握できるようにする。
【解決手段】入力制御部102により文章データを受信した場合に、当該文章データをキーワード抽出部103により形態素解析してキーワードを抽出し、この抽出したキーワードをもとに箇条書きテキスト記憶部110から対応する箇条書きテキストデータを取得すると共に、断片手話データ記憶部120から対応する断片手話映像データを取得する。そして、上記取得した箇条書きテキストデータ及び断片手話映像データを、提示テンプレート記憶部130から取得した提示テンプレートのレイアウトに従い合成して提示情報コンテンツを作成し、この提示情報コンテンツを出力制御部105により表示装置106に表示させる。 (もっと読む)


【課題】用語辞書の汎用的かつ拡張可能なテンプレートを提供すること。
【解決手段】用語辞書汎用テンプレート2は、用語辞書DB32に登録されている用語に関するデータを参照するDB参照機能21と、入力した用語に関するデータを用語辞書DB32に登録するDB登録機能22と、定義した用語を英訳する英訳機能23とを備え、用語辞書作成補助機能3は、キーワードや入力された用語をカテゴリに分類するカテゴリ分類機能31と、単語英訳する英訳機能34と、文節区切り機能36とを備える。 (もっと読む)


【課題】日本語文章を機械翻訳するときに用いられる汎用のアプリケーションで機械翻訳がし易いように日本語文章を修正する日本語文章修正装置を提供する。
【解決手段】機械翻訳し易い文章構成、用字・用語およびスタイルがそれぞれ登録された文章構成データベース、用字・用語データベースおよびスタイルデータベースと、読み込む日本語原文章から上記構成、用字・用語またはスタイルに関するルールに反する構成、用字・用語またはスタイルを抽出する修正箇所抽出手段と、上記抽出された構成、用字・用語またはスタイルを表示する表示手段と、外部から入力されたデータを用いて上記抽出された構成、用字・用語またはスタイルを訂正、追加または削除して上記日本語原文章を修正する修正手段と、修正により得られた翻訳易文章を出力する出力手段と、を有する。 (もっと読む)


【課題】
人が会話の中で自然に使用する複文や倒置表現など多様な形態を持つ日本語などの自然言語に対する応答を行うことを可能とする。
【解決手段】
入力手段1−1で入力された自然言語において文章の一部を分類種別とし、第1の分類手段1−2で前記入力を少なくとも一つの分類種別に分類し、前記少なくとも一つの分類種別における所定の分類種別がアクション記憶手段1−4に登録されていれば、応答取得手段1−3は1−4から所定の処理を取得し前記所定の処理を行い応答情報を取得する。1−4に登録されていなければ応答なしに対応する応答情報を取得する。前記取得した応答情報を出力手段1−5で出力する。 (もっと読む)


1 - 19 / 19