説明

Fターム[5B091AA15]の内容

機械翻訳 (6,566) | 言語 (1,300) | 自然言語・解析結果間(例;日本語文解析) (617)

Fターム[5B091AA15]に分類される特許

1 - 20 / 617



【課題】 他の単語データを利用して、属性が未知である単語に対し、付与すべき属性を推定する。
【解決手段】 本発明は、入力単語と共起する単語のパターンを特徴パターンとして抽出し、入力された単語共起データから特徴パターンと合致する共起語を入力単語の同類語候補として抽出し、入力単語及び各同類語に対し、共起する単語のパターンを特徴パターンとして抽出し、その特徴パターンを要素とし、その共起頻度を値とするベクトルを作成する。入力単語と各同類語候補との関連度を算出し、関連度の高いものを同類語として抽出する。同類語のカテゴリの重複数を調べて、重複数が多いカテゴリを入力単語のカテゴリとして推定し、当該カテゴリを属性として付与した単語を属性付単語として出力する。 (もっと読む)


【課題】学習データを必要とせずにテキストセグメンテーションが可能なWeb検索を利用したテキストセグメンテーションを実現する。
【解決手段】本発明は、入力されたテキストを文単位に分割し、分割された文を形態素解析し、形態素解析された名詞、副詞、動詞、形容詞、形容動詞を検索語として抽出し、検索語に基づいてウェブ検索したテキストを形態素解析し、解析された形態素のうちで、名詞、副詞、動詞、形容詞、形容動詞を関連語として取得し、検索語と関連語との組み合わせであるキーワード集合を用いて、入力テキストを分割した複数の文同士の連結性を判定し、該連結性の谷と谷の間にある文同士である意味段落を抽出することによって入力テキストを分割する。 (もっと読む)


【課題】学習データを必要とせずにテキストセグメンテーションが可能なWeb検索を利用したテキストセグメンテーションを実現する。
【解決手段】本発明は、入力されたテキストを文単位に分割し、分割された文を形態素解析し、形態素解析された助詞を除く全ての単語を検索語として抽出し、活用形のある単語を終止形に変換し、検索語に基づいてウェブ検索し、検索されたテキストを形態素解析し、助詞を除く全ての単語を関連語として抽出し、活用形のある単語を終止形に変換し、検索語と関連語記憶手段に格納されている関連語との組み合わせであるキーワード集合を用いて、文同士の連結性に基づいて意味段落を求め、分割候補を作成し、分割候補を評価して一つの分割結果を選択して出力する。 (もっと読む)


【課題】付け句に適切な季語の候補を提示できるようにして、付け句の創作を有効に支援する。
【解決手段】俳句公開サーバは、端末装置からの推薦季語要求の受信に応じて、発句として指定された俳句を解析して季語、自立語、切れ字を抽出し、これらの抽出した語句を利用して、季語データベースから、付け句の制約を満たし、かつ、発句の内容に対応する季語を選択する。そして、このように選択した季語を推薦季語として推薦季語要求元の端末装置に送信する。端末装置は、付け句創作支援として、受信した推薦季語を表示してユーザに提示する。 (もっと読む)


【課題】同形異音異義語の漢字と関連付けられるピンインに対して望ましくない中国語変換候補を生成しない方法及び装置を提供する。
【解決手段】言語変換において複数の読み方の曖昧性を除去することが開示される。これは、対象記号系での入力データの記号表現を含む文字の集合に変換される入力データを受信することと、対象記号系の同形異音異義語の文字が入力データの対応する一部分を表すために使用されるべきである確率を判定するために文字の第1の読み方と第2の読み方とを区別する言語モデルを使用することとを含む。 (もっと読む)


【課題】FAQ作成支援システムを提供する。
【解決手段】実施形態のFAQ作成支援システムは、問合せ代表文(問合せ文とその回答文を含む文書の文書集合において各文書それぞれの問合せ文から抽出される複数の問合せ代表文のうち同一の問合せ代表文に基づいて、一の問合せ代表文に複数の抽出元の問合せ文に対応する文書が関連付けられた文)と、回答代表文(各文書それぞれの回答文から抽出される複数の回答代表文のうち同一の回答代表文に基づいて、一の回答代表文に複数の抽出元の回答文に対応する文書が関連付けられた文)との対を、問合せ代表文に関連付く各文書が回答代表文それぞれに関連付いている各文書とマッチングする文書数で評価し、問合せ代表文と回答代表文との対に基づくFAQの作成環境を提供する。 (もっと読む)


【課題】効率的に言語解析用の辞書を作成する辞書作成装置等を提供する。
【解決手段】未知語判定プログラム25は、記憶部から書籍のOCRデータを入力し、書誌情報データベース21と照合して作者及びジャンルを特定するとともに、処理対象の語句が、未知語か否かを判定する。未知語の語句については、辞書登録プログラム26に処理を引き渡す。辞書登録プログラム26は、作者別辞書登録プログラム26A、ジャンル別辞書登録プログラム26Bを含み、作者別辞書データベース22、ジャンル別辞書データベース23、および標準辞書データベース24に未知語を登録する。 (もっと読む)


【課題】予め記憶した文に含まれないキーワードが入力された場合でもユーザの意図に即した応答文を生成する対話装置を実現する。
【解決手段】実施形態の対話装置におけるキーワード取得手段は、ユーザからのキーワードを取得する。概念検索手段は、概念辞書から前記キーワードの概念を検索する。応答文検索手段は、応答文テンプレート辞書から前記概念検索手段で検索された概念を含む応答文テンプレートを検索する。組み合わせ生成手段は、前記応答文検索手段で検索された応答文テンプレート中の自立語と前記キーワードとの組み合わせを生成する。共起スコア付与手段は、共起辞書を利用して前記組み合わせ生成手段で生成された組み合わせに共起スコアを付与する。応答文生成手段は、前記キーワードと、前記応答文検索手段で検索された応答文テンプレートと、前記共起スコア付与手段で付与された共起スコアとを利用して、ユーザに提示する応答文を生成する。 (もっと読む)


【課題】専門領域での複合語の多い文書中の複合語の概念を推定すること。
【解決手段】複合語を構成語に分割し、同一の構成語を持つ複合語間の共起ベクトルの距離に基づく集約度を構成語支配度として算出し、構成語支配度に基づき各構成語の概念に重み付けを行った合成概念として未知の複合語の概念を抽出することで、専門領域での複合語の多い文書中の複合語の概念を推定する。 (もっと読む)


【課題】情報システム構築に関する提案書や仕様書といった特定の案件に関する文書群で一般的な意味と異なる意味を有して使用されている多義語を判別してその文章の曖昧さを改善する。
【解決手段】多義語抽出システムとして、入力を受けた所定の文章中の各単語を抽出する単語分析部と、任意の単語を基軸単語として選択し、該基軸単語と共起関係とみなされる基軸単語共起語とその共起数とで表される基軸単語共起ベクトルを抽出する基軸単語共起ベクトル抽出部と、基軸単語共起ベクトルの各基軸単語共起語の共起語概念を一般概念から推定する共起語概念推定部と、推定した共起語概念群について、対応する共起語概念間の類似性に基づき、選択した基軸単語に関する各基軸単語共起語のクラスタリングを行う共起語分類部と、複数のクラスタが存在した際に多義語候補として抽出する多義語候補推定部と、抽出した候補を出力する多義語候補出力部とを設ける。 (もっと読む)


【課題】情報システム構築に関する提案書や仕様書等、所定の案件に関する文書で、意義は同じで語形が異なる同義語のある文章の曖昧さを改善する。
【解決手段】文章に使用されている各単語毎の品詞や格、組み合される助詞、単語間の係り受け関係に関する単語情報の抽出を行う単語分析部と、任意の単語を基軸単語として選択し、基軸単語と共起関係にある共起語とその共起数に基づく基軸単語共起ベクトルを全基軸単語についてまとめた基軸単語共起表を作成する基軸単語共起表作成部と、単語の一般概念情報を概念データベースに問い合わせ、各基軸単語共起ベクトルの各共起語を概念に変換した基軸単語概念ベクトルを全基軸単語についてまとめた基軸単語概念表を作成する単語概念推定部と、各基軸単語概念ベクトル間の類似性を判定し、類似性が高い基軸単語の組合せを同義語候補として抽出する同義語候補推定部と、同義語候補を出力する同義語候補出力部とを備える。 (もっと読む)


【課題】文書テキストだけではなく音声テキストに基づいても、精度の高い同義語辞書を作成することができる同義語辞書生成技術を提供する。
【解決手段】同義語辞書を作成する際に基準となる基準語彙を含む文脈と、基準語彙に関連する関連語彙を含む文脈の類似性を算出し、基準語彙の表記と関連語彙の表記の類似性を算出し、基準語彙の読みと関連語彙の読みの類似性を算出し、算出された文脈、表記及び読みの類似性を用いて基準語彙及び関連語彙についての同義指標を求め、その同義指標の大きさに基づき関連語彙が基準語彙の同義語であるか否かを判定する。 (もっと読む)


【課題】大量の文書の中から薀蓄文を抽出する。
【解決手段】本開示の情報処理装置は、収集された1以上の文章から成る文書をトピック解析することにより、前記文書を成す各文章に対して、ローカルトピックの各項目に対する適合の程度を示す確率を算出し、収集された前記文書を言語解析することにより、ローカルトピックの項目毎に特有の言い回しパターンを検出し、収集された前記文書を成す各文章に対する評価者の評価に基づいて各文章に対するトピック有用度を設定し、トピック解析結果と前記トピック有用度に基づき、ローカルトピックの各項目に対して合計評価値を設定し、前記合計評価値に基づいてローカルトピックの項目を選別し、選別したローカルトピックの項目に特有の言い回しパターンに適合する文章を、収集された文書から薀蓄文候補として抽出する。 (もっと読む)


【課題】作業内容を説明した文書から、実際に作業者が行う作業のうち適切な作業を抽出する。
【解決手段】文書処理方法は、作業内容を説明した第1文書データを格納する第1DBから、動詞又はサ変名詞を含む自立語のうち、当該自立語に係る主語が無いという条件を満たす自立語を抽出し第1データ格納部に格納する工程と、作業内容を第1文書データより詳細に説明した第2文書データを格納する第2DBから、動詞又はサ変名詞を含む自立語のうち、上記条件を満たす自立語を抽出し第2データ格納部に格納する工程と、第1データ格納部に格納されておらず且つ第2データ格納部に格納されている自立語と、抽出すべきでない自立語を格納する第3データ格納部に格納されている自立語とを、第1及び第2データ格納部に格納されている自立語の集合から除外し、当該自立語の集合における残余の自立語を第4データ格納部に格納する工程とを含む。 (もっと読む)


【課題】感情語辞書を事前に用意する必要がなく、怒り感情を頑健に推定可能とする。
【解決手段】対話テキストを話者別のテキストに分割する話者分割処理部11と、分割された話者別のテキストの形態素を解析し、各話者別のテキストを形態素単位に分割した形態素解析結果を出力する形態素解析処理部12と、形態素解析結果を用い、話者別のテキスト中の同じ内容語の出現頻度を表す指標である発話内容冗長性特徴量を、各話者別のテキストに対して求める発話内容冗長性特徴量抽出部13と、形態素解析結果を用い、話者別のテキスト中の内容語の出現頻度を表す指標である発話内容情報性特徴量を、各話者別のテキストに対して求める発話内容情報性特徴量抽出部14と、予め学習した感情識別器30を用い、発話内容冗長性特徴量及び発話内容情報性特徴量の少なくとも一方を用いて対話テキストの対話が怒り対話か否かを推定する感情識別部20とを具備する。 (もっと読む)


【課題】入力自然文の意味を表現する意味構造を構築し、その意味構造を細分化し、その細分化した意味構造から自然文を生成し、自然文の細部の意味を提示する。
【解決手段】
入力自然文に形態素解析や構文解析を行い、その解析結果に意味構築処理を行って、部分的な意味構造を構築し、部分的な意味構造を意味根で結合しながら、入力自然文の全体の意味構造を構築する。その意味構造を意味根で細分化して、細分化した当該意味構造から自然文を生成して明示すると入力自然文の意味が細部にまで検証できる。
書き手は、文法と知識を用いて文を作成するが、読み手も書き手と同じ知識を共有するとはかぎらない。本発明では、知識を持たない読み手の立場に立ち、主に文法情報だけで意味解析する。それによって、知識を持たない読み手でも精確に理解できる文を書き手が作成できるように支援する。そのような文作成支援自然文処理法。 (もっと読む)


【課題】オンライン辞書について辞書管理の負担を軽減させた高品質な類似検索機能を提供する。
【解決手段】類似検索部3は、辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する。主要部特定部4は、類似検索手段で特定された類似表記と入力表記との共通部分を特定し、特定された共通部分が主要部辞書に存在すれば、該共通部分を主要部候補と判定する。この主要部候補を類似表記から除外した付加部候補が付加部辞書に存在するか否かを判定し、判定結果に応じて主要部候補を主要部と確定する。距離算出部5は、確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する。更新確認部6は、算出された編集距離順に類似表記・主要部・付加部を辞書管理者に提示する。 (もっと読む)


【課題】より迅速に結果を出力可能な知識獲得装置を提供すること。
【解決手段】特定の関係を有する単語の対と、該単語の対を含む文に関する形態素の構造とを関連付けて持つ単語対テーブルを格納した第1の記憶手段と、前記第1の記憶手段から抽出した単語の対と形態素の構造に、検索対象を限定する特定の事象を加えた検索キーを作成し、該検索キーで検索対象の文書群を格納した第2の記憶手段を検索して該検索キーの出現数を求め、求めた出現数を前記単語の対と前記形態素の構造に関連付けて前記単語対テーブルに格納する出現数情報取得手段と、前記単語対テーブルを参照し、各単語の対に関する形態素の構造毎の出現数傾向と、全単語の対に関する形態素の構造毎の出現数傾向との合致程度に基づいて、前記各単語の対と前記特定の事象との関連性を評価した評価値を出力する評価手段と、を備える知識獲得装置。 (もっと読む)


【課題】商品名の記載において特徴的に出てくる販売促進目的の語句を考慮した商品名の同一性判定を行うことができる商品名同一性判定装置を提供する。
【解決手段】商品名表記ペア110を入力とし、商品名情報が蓄積された商品表記データベース120中に含まれる語句それぞれに対して、特定の商品を識別するのに有用な語句に対して高い値となり、複数の商品に含まれる語句に対して低い値となる商品スコアを算出し、商品スコアデータベース150に蓄積する商品スコア算出手段140と、商品名表記ペア110を解析して、それぞれの商品名表記に含まれる語句の共通部分と差異部分を取得し、前記データベース150にアクセスして前記語句の商品スコアを取得し、前記共通して出現する語句の商品スコアが高く、片側のみに出現する語句の商品スコアが低い場合に、入力された商品名表記ペア110は同一性が高いと判定する同一性判定手段と、を備える。 (もっと読む)


1 - 20 / 617