説明

Fターム[5B091AA15]の内容

機械翻訳 (6,566) | 言語 (1,300) | 自然言語・解析結果間(例;日本語文解析) (617)

Fターム[5B091AA15]に分類される特許

161 - 180 / 617


【課題】フィルタリングする確率が高いフィルタリング処理方法を提供する。
【解決手段】特定の1または複数のユーザーの過去の発言をすべて連結して一文にする工程と、前記文を形態素に解析する工程と、異なる2つの前記形態素を共起語とし、共起度を計算する工程と、前記形態素から素性を生成する工程と、前記形態素から拡張素性を生成する工程と、前記素性及び前記拡張素性に素性パラメータを与える工程とを含む学習工程と、任意のユーザーにより新たに入力された文をフィルタリングするべきか判断する工程を含む分類工程を含むフィルタリング処理方法。 (もっと読む)


【課題】 追加説明を含む入力文について、正しく翻訳できるようにすること。
【解決手段】 翻訳装置は、入力文から追加説明部分を抽出する抽出手段と、入力文から前記抽出手段で追加説明部分が抽出され前記追加説明部分が除かれた文に、当該追加説明部分の位置を示す管理情報を付加する付加手段と、前記追加説明部分が除かれた文を翻訳する第1の翻訳手段と、前記抽出手段で抽出された追加説明部分を翻訳する第2の翻訳手段と、前記管理情報に基づいて、前記第1及び第2の翻訳手段の翻訳結果を合成する合成手段と、を具備することを特徴とする。 (もっと読む)


【課題】入力文書中の「動作性名詞+助詞+機能動詞」の組み合わせからなる述部が、正規化すべき「機能動詞構造」か、それとも正規化すべきでない「本動詞構造」もしくは「慣用句構造」かを、人手に頼ることなく自動的に判別可能とすること。
【解決手段】主題化不可度計算部61で、機能動詞構造候補の標準形及び主題化変形文の所定のコーパスにおけるそれぞれの出現頻度から主題化不可度を計算し、慣用表現計算部62で、機能動詞構造候補における「動作性名詞」と「助詞+機能動詞」との間の連語度を慣用表現度として計算し、自動判別部63で、主題化不可度及び慣用表現度を素性とし、機能動詞構造、本動詞構造及び慣用句構造をクラスとする機能動詞構造に関する所定の正解データに基づいて自動学習により作成された分類器を用いて、機能動詞構造候補の主題化不可度及び慣用表現度から機能動詞構造、本動詞構造及び慣用句構造のいずれであるかを判別する。 (もっと読む)


【課題】ユーザが第二言語の知識を有していなくても、第一言語である日本語の知識のみで、漢字文字列からなる未知語の対訳を得ることである。
【解決手段】漢字解析部28は入力装置18から入力された未知語を1文字または2文字単位に区切り単漢字辞書部33を辞書引きして区切り文字ごとの読みと語義とを求め、語義選択画面表示部29は区切り文字ごとの語義を選択するための語義選択画面を表示し、言い換え候補生成部30は、語義選択画面からユーザから特定の語義が選択されたときは漢字熟語パターン情報記憶部34の言い換え表現式に当てはまるパターンの言い換え候補を生成し、言い換え候補選択画面表示部31は言い換え候補選択画面を表示し、翻訳部32は言い換え候補からユーザにより選択された言い換え表現を翻訳して未知語とその翻訳結果の訳語とを対にして翻訳辞書部35に辞書登録する。 (もっと読む)


【課題】固有名詞の換喩表現の抽出精度の向上を図ること。
【解決手段】自然言語処理装置は、所与の固有名詞又は所与の固有名詞と同格の語、を主語とし、且つ、動詞リストに記憶される、固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞を含む文を検索する文検索部20と、文検索部20により検索された文に含まれる、動詞リストの動詞の目的語を取得する目的語取得部22と、目的語取得部22により取得された目的語を上記所与の固有名詞の換喩表現として辞書に登録する登録部24と、を含む。 (もっと読む)


【課題】文書から抽出された単語を、各単語の出現文脈に適した同じ意味を示す同義語に展開する。
【解決手段】ある単語の係り先となる単語を含む第1文脈情報が格納された第1データベースを参照して、第1単語の第1文脈情報と第2単語の第1文脈情報とを比較することによって、類似度を計算し、類似度が高い第2単語を第1単語の同義語候補に決定し、ある単語から文章中で所定の語数内に出現する単語を含む第2文脈情報が格納された第2データベースを参照して、第1単語の第2文脈情報と少なくとも一以上の同義語候補の第2文脈情報とを比較することによって、文脈適合度を計算し、類似度及び文脈適合度に基づいて、同義語候補の同義語展開スコアを計算し、同義語展開スコアに基づいて、同義語候補から第1単語の同義語を決定する。 (もっと読む)


【課題】ユーザの対話意欲を促進させることができる応答を可能にする。
【解決手段】本発明に係る対話処理装置1は、ユーザの音声を認識する音声認識部2と、音声認識手段2による認識結果に基づいて、ユーザが発話した発話文の少なくとも係り受け関係を解析する構文解析部3と、構文解析手段3により解析された係り受け関係に関する情報を、ユーザの発話の進行に伴い蓄積していく係り受け関係記憶手段4と、係り受け関係記憶手段4に蓄積された係り受け関係に関する情報に基づいて、発話文の内容を纏めた纏め文を生成する応答生成手段6とを備える。 (もっと読む)


【課題】Web上の文書などの電子化文書に基づいて、高い品質精度の言語資源情報を生成する。
【解決手段】意味クラス制限部13により、意味クラス制限情報DB23Bに登録されている意味クラス制限条件を参照し、対象語の特徴量に基づいて当該対象語が持つ意味の大分類を特定することにより、シソーラスに記述されている各意味クラスのうちから当該対象語に対して付与する意味クラスの種類を制限し、意味クラス選択部14により、意味クラス推定条件DB2Cに登録されている意味クラス推定条件を参照して、大分類に含まれる意味クラスごとに、対象語の特徴量に基づいて当該意味クラスと当該対象語との関係度合いを示す評価値を算出し、これら評価値に基づいて当該対象語との関係度合いが大きい意味クラスを、当該対象語に付与する意味クラスとして選択する。 (もっと読む)


【課題】膨大な量の学習コーパスを必要とすることなく、精度の高い単語出現確率を算出する。
【解決手段】直接出現確率算出部15Bにより、語義別見出語と語義文の組み合わせごとに、当該語義文内に当該語義別見出語が出現する直接出現確率14Cを算出し、間接共起確率算出部15Cにより、任意の語義別見出語が複数の語義文においてそれぞれ異なる語義別見出語と共起するという連接共起関係を経ることにより、任意の2つの語義別見出語が1つ以上の語義別見出語を介して間接的に共起する間接共起確率14Dを語義別見出語対ごとに算出し、単語出現確率算出部15Dにより、間接共起確率14Dから生成した間接共起確率行列Cと、直接出現確率14Cから生成した直接出現確率行列Aとの行列積CAを算出し、当該行列積CAの各行列要素を単語出現確率14Eとして出力する。 (もっと読む)


ライティングシステム及び言語を検出するための方法、システム、及びコンピュータプログラム製品を含む装置が開示される。一実施例では、方法が提供される。この方法は、テキストを受け入れ、かなりの量が第1言語を表現するテキストの第1セグメントを検出し、かなりの量が第2言語を表現するテキストの第2セグメントを検出し、テキスト中に含まれるサイズxの各nグラムに対してスコアを確認し、スコアの変化に基づき、テキストにおいて第1言語から第2言語への遷移を識別するエッジを検出することを含む。
(もっと読む)


【課題】話者が発する音声に関する情報を登録する際に、音声の認識の状態を話者が確認することが可能であるとともに、第1言語を用いる話者と第2言語を用いる通話相手との通話時に、精度の高い翻訳を行うことが可能な自動翻訳対応電話システムを提供する。
【解決手段】この自動翻訳対応電話システム1は、予め登録された話者が発する音声に関する情報に基づいて、日本語の音声を、日本語の文字として認識するための音声認識部19と、日本語に含まれる方言に対応する方言辞書21bを有する電子辞書部21を含み、日本語の文字を英語の文字に変換するための翻訳エンジン部20と、話者が発する音声に関する情報を登録する際に、話者が確認可能なように日本語の文字を通知するようにスピーカ12bを制御する制御部13とを備え、制御部13は、日本語の文字を英語の文字に変換する際に、方言辞書21bを選択して参照するように構成されている。 (もっと読む)


入力の認識のためにコンテキスト特定文典の1セットとして全般の文典を利用するアーキテクチャが開示され、コンテキスト特定文典のそれぞれがサブタスクカテゴリおよび地理的地域のような特定のコンテキストに対応する。文典は、共同で全体の領域をカバーする。また、同じ入力に対して、複数の認識を並行的に実行することができ、各認識パスは1つ以上のコンテキスト特定文典を用いる。異なる認識器−文典からの複数の中間認識結果は、複数の認識結果に基づいてダイナミックに構成された文典、もしかすると他の領域知識を用いて再認識を実行することにより、または複数の認識結果および他の領域知識から抽出された分類特徴に基づいて作動する統計的分類器を用いて当選者を選択することにより、調整することができる。
(もっと読む)


【課題】予め辞書を用意することなく、語と語との関係及びその関係を満たす語の集合を抽出し得る、関係抽出装置、関係抽出方法、及びプログラムを提供する。
【解決手段】語と語との関係及びその関係を満たす語の集合を抽出する関係抽出装置11を用いる。関係抽出装置11は、複数の語を要素として含む構造化データから、2以上の要素を要素集合として抽出し、抽出した要素集合を、予め設定された語と語との関係を表す文字列パターンに当てはめて、複数の文字列表現を作成する文字列表現作成部3と、作成された複数の文字列表現それぞれが文書集合中に出現しているかどうかを判定し、文書集合中に出現している文字列表現を、語と語との関係及びその関係を満たす語の集合として出力する文字列表現判定部4とを備えている。 (もっと読む)


【課題】適切な論理関係を想起させる単語のペアを抽出することができる語句関係抽出装置を提供する。
【解決手段】本発明の語句関係抽出装置は、論理関係を有する2つの文又は複文である論理関係文対から、共通のトピックである共通トピックを抽出する共通トピック抽出手段と、前記論理関係文対の各文から、前記共通トピック抽出手段により抽出された共通トピックに対応する語句を語句対として抽出する語句対抽出手段と、を備える。 (もっと読む)


【課題】原文データ中の特定の用語に対してその語の略語が併記されている場合、用語の複数ある翻訳候補から生成した略語と、文中に記載された略語とが一致する翻訳候補を選択して翻訳を行うことである。
【解決手段】用語・略語抽出部26は、原文解析・翻訳部25が辞書部31を参照して入力部22で受け付けた原文データを解析した解析結果を参照して、原文から略語とそれに対応する展開表記の用語とを抽出し、生成略語選択部28は、略語生成部27によって生成された生成略語と用語・略語抽出部26が原文データから抽出した抽出略語とを比較して一致度が100%の生成略語を選択し、原文解析・翻訳部25は、略語生成部27が生成の元とした第二言語の翻訳候補を翻訳結果に使用する。 (もっと読む)


【課題】連続絵文字等について、実際の使われ方に基づいて辞書を生成する。
【解決手段】取得されたコンテンツデータから、単独絵文字等辞書を参照して、連続絵文字等と、当該連続絵文字等が含まれる文章と、当該文章を含む記事とを抽出する連続絵文字等・文章・記事抽出手段と、抽出された記事から単語辞書を参照して記事特徴語を抽出する記事特徴語抽出手段と、取得されたコンテンツデータから、抽出された文章の連続絵文字等を除外した部分に一致する他の文章を抽出する連続絵文字等除外文章抽出手段と、抽出された他の文章から単語辞書を参照して文章特徴語を抽出する文章特徴語抽出手段と、抽出された記事特徴語と文章特徴語から類義語辞書を参照して類似するか否か判定する特徴語類似判定手段と、類似すると判定された場合に、抽出された連続絵文字等と文章特徴語とを対応付けて連続絵文字等辞書に登録する連続絵文字等データ登録手段とを備える。 (もっと読む)


【課題】意味的な対応関係を有するテキストの組における翻訳先のテキスト同士が十分に類似していない場合でも、精度の高い翻訳モデルの作成を可能とし、正確なクラスタリングを可能とすること。
【解決手段】意味対応入替部2により、意味対応テキスト組セット1の意味的な対応関係を入れ替えた意味対応入替テキスト組セット1’を作成し、翻訳確率計算部3より、意味対応テキスト組セット1及び意味対応入替テキスト組セット1’中における単語から単語への翻訳確率をそれぞれ計算して対応非入替翻訳モデル4及び対応入替翻訳モデル5を作成し、翻訳確率合成部6により、翻訳モデル4及び5から意味対応テキスト組セット1中の各単語が別の単語に翻訳される翻訳確率を計算して合成翻訳モデル7を作成し、この合成翻訳モデル7を用いて、入力されたテキストの集合をクラスタリングする。 (もっと読む)


【課題】高精度の類義語辞書を構築する。
【解決手段】文書データ中において所定規則で出現する文字列ペアを類義語候補抽出部12で相互の類義語候補として抽出した後、関連度管理部13で、一方の文字列に対する他方の文字列の関連性が高くなるほど小さくなるように重み付けされた第1関連値を導出するとともに、他方の文字列に対する一方の文字列の関連性が高くなるほど小さくなるように重み付けされた第2関連値を導出し、第1関連値及び第2関連値を当該文字列ペアと関連付けて保持する。類義語辞書登録部14は、一方の文字列に対して第1関連値が第1閾値以下で、且つ、第2関連値が第2閾値以下となる他方の文字列を一方の文字列の類義語として、類義語辞書26に辞書登録する。 (もっと読む)


【課題】入力した文章がどのような意味を意図するかを、より精度よく解釈することができ、正確な検索を行うことができる。
【解決手段】複数の単語の組み合わせである流通言語語彙と、流通言語語彙を含む自然文の意味を示す意味情報とを対応付けて格納するデータウェア205と、ユーザから自然文として入力される質問文を取得する質問文受信部211と、質問文受信部211が取得した質問文を複数の単語に分解する質問文語彙分解部212と、データウェア205において、複数の単語の組み合わせである入力流通言語語彙に対応付けられている意味情報を検索する同義文検索部214とを備えた。 (もっと読む)


【課題】 状況や条件等に応じて内容が変化するオントロジーを効率良く作成させる。
【解決手段】 条件の組み合わせという次元によって、内容が変化する、同一の概念体系に係る1又は複数の多次元オントロジーの作成、更新を支援するオントロジー作成支援装置に関する。条件なし時用の基本オントロジーを格納しておくと共に、条件存在時の多次元オントロジーと基本オントロジーとの差分情報である次元別オントロジーを格納しておく。指定された条件の組み合わせに従った次元別オントロジーと基本オントロジーとを合成し、表示/編集用オントロジーを生成し、オペレータの操作に応じてこれを編集する。保存指令時には、表示/編集用オントロジーの基本オントロジーからの差分情報を、次元別オントロジーとして格納する。 (もっと読む)


161 - 180 / 617