説明

国際特許分類[G06F17/27]の内容

物理学 (1,541,580) | 計算;計数 (381,677) | 電気的デジタルデータ処理 (228,215) | 特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法 (34,028) | 自然言語データの取扱い (7,890) | 自動言語解析,例.構文解析,綴字訂正 (543)

国際特許分類[G06F17/27]に分類される特許

101 - 110 / 543


【課題】異なる複数の文章に含まれる単語を用いて同義語を検出することが可能であって、汎用性を有し、幅広く同義語を定義することが可能な同義語辞書生成装置等を提供する。
【解決手段】文書解析システム100は、入力インターフェース110を介して取得した各アンケートデータに対して、評価表現を示す評価表現テキストと当該評価テキストが修飾する被修飾語テキストのセットをテキストセットとして抽出しつつ、評価表現テキスト、カテゴリ情報及び被修飾語テキストの出現頻度数に基づいて同義語を定義するようになっている。 (もっと読む)


【課題】対象文章情報について助詞落ちの有無を検出する共に、落ちた助詞を補完することによって、対象文章情報の解析精度を向上させることができる助詞落ち補完プログラム等を提供する。
【解決手段】助詞補完プログラムは、助詞落ち表現を含まない基準文章情報を蓄積した基準文章蓄積手段と、基準文章情報から、助詞を削除することによって助詞落ち文章情報を生成する助詞落ち文章生成手段と、助詞落ち文章情報を正例データとし、基準文章情報を負例データとして学習データベースを生成すると共に、該学習データベースを用いて、入力された対象文章情報から、助詞落ち箇所を特定する識別エンジン手段としてコンピュータを機能させる。 (もっと読む)


【課題】多種にわたる用途に対応可能な形態素を出力可能な形態素結合装置、形態素結合方法及び自然言語処理システムを提供すること。
【解決手段】自然言語処理システム(1)は、入力された対象文章を品詞毎に形態素解析する形態素解析装置(10)と、形態素解析された文章の形態素配列の一部を結合する形態素結合装置(20)と、を備える。そして、この形態素結合装置(20)は、形態素解析装置(10)により形態素解析された形態素配列の一部を結合ルール(230)従って結合するとともに、結合した後の表現の品詞を特定する形態素結合手段(22)と、結合した形態素配列を出力する形態素配列出力手段(24)と、を備える。 (もっと読む)


【課題】名詞間関係及び動詞/形容詞間関係を一括して語間関係として扱い、獲得したい語間関係を予め定義することなく、意味的に類似している語対を二項関係に分類することができる二項関係分類プログラム等を提供する。
【解決手段】文章集合蓄積部から所定閾値以上で共起しやすい複数の語対を抽出し、文章集合蓄積部から語対の語毎に共起する係り受け語集合を抽出する。次に、第1の係り受け語集合に出現し且つ第2の係り受け語集合に出現しない係り受け語からなる第1の特徴係り受け語集合と、第2の係り受け語集合に出現し且つ第1の係り受け語集合に出現しない係り受け語からなる第2の特徴係り受け語集合とを抽出する。更に、係り受け語毎に、語と共起する文書集合中の出現頻度とを計数し、ベクトルを導出し、ベクトル間類似度に基づく分割最適化クラスタリングによって、語対クラスタを生成する。 (もっと読む)


【課題】獲得したい事態間関係を予め定義することなく、意味的に類似している事態対を二項関係に分類することができる二項関係分類プログラム等を提供する。
【解決手段】文章集合蓄積部から所定閾値以上で共起しやすい名詞対を抽出し、文章集合蓄積部から名詞対の名詞毎に共起する述語集合を抽出し、名詞毎の当該述語集合の出現頻度を表すベクトルに基づく当該名詞対の類似度を用いて名詞対をクラスタリングする。次に、抽出された名詞対について、各名詞と当該述語集合の述語とからなる複数の事態対を生成する。次に、複数の事態対から複数の述語対を抽出し、文章集合蓄積部から述語対の述語毎に共起する名詞集合を抽出し、述語毎の当該名詞集合の出現頻度を表すベクトルに基づく当該述語対の類似度を用いて述語対をクラスタリングする。そして、事態対に含まれる名詞対及び述語対の類似度に基づいて、事態対をクラスタリングする。 (もっと読む)


【課題】
テキスト情報で構成された建築基準などの技術基準文書を、自然言語処理技術を適用し、コンピュータプログラムに自動変換する。
【解決手段】
本発明に係る技術基準文書判定プログラムは、テキスト情報で構成された技術基準文書に対し、形態素解析と係り受け解析とを施す解析処理と、解析処理の解析結果に基づいて、技術基準文書を条件式を作成する変換処理と、変換処理にて変換された条件式を、建築用CADプログラムのCAD情報と照合し、判定結果を出力する判定処理と、をコンピュータに実行させることを特徴としている。 (もっと読む)


【課題】テキストの読み上げ精度を向上させ、聞き手が判りやすい自然な読み上げ音声を生成することのできる音声合成装置を提供する。
【解決手段】音声合成装置1は、任意の対象についての情報を示す第1のテキストを形態素解析して第1の解析結果を出力する第1解析部5と、前記第1のテキストが示す情報と同一の対象について表現が異なる情報を示す第2のテキストを形態素解析し、前記第1の解析結果を参照して第2の解析結果を出力する第2解析部6と、前記第2の解析結果に基づいて、前記第2のテキストに関する合成音声を生成するための表音文字列を生成する表音文字列生成部8とを備える。 (もっと読む)


【課題】述語項構造解析において、大規模かつ高精度な格フレーム辞書を利用することなく、モデルの複雑さを回避し、計算効率を高める文構造解析装置を提供する。
【解決手段】入力された文章を、形態素を単位とした単語に分割する形態素解析手段と、形態素解析手段によって分割された各単語を基に、複数の文節からなる文節列を生成する文節解析手段と、文節解析手段によって生成された各文節間の係り受け関係を解析する係り受け解析手段と、を備え、係り受け解析手段は、文節解析手段によって生成された文節列から、任意の異なる文節のペアを選択し、選択された文節ペアのそれぞれに対して係り受けスコアを計算してメモリに格納し、所定の閾値以上の係り受けスコアを持つ文節ペアに係り受け関係があると解析する。 (もっと読む)


【課題】 固有の名称が含まれる文字列から,辞書に未登録の略称を検索できるようにする。
【解決手段】 データパース装置1は,検索対象を入力するデータ入力部13と,辞書記憶部11の辞書をもとに検索対象から法人名称を検索する辞書引き部14と,検索対象に辞書に登録されていない文字列がある場合に,略称を検索する略称検索部15を備える。略称検索部15は,辞書の登録語と部分的に一致する登録語を検索し,検索した登録語から,部分一致する範囲が長く一致の割合が高いものを特定し,特定した登録語と一致する範囲を略称とし,特定した登録語をその正式名称とする。 (もっと読む)


【課題】対象とする語句が見出し語となっている概念が概念辞書中に存在しない場合において、対象とする語句の上位概念を出力する上位概念出力プログラム及び上位概念出力装置を提供する。
【解決手段】上位概念出力装置1は、語句を受け付ける表現受付手段100と、表現受付手段100により受け付けられた語句と関連する語句との関連度を計算し、当該関連度に基づいて関連する語句から関連語を検索する関連語検索手段101と、概念辞書111に基づいて、関連語を見出し語として持つ概念を抽出し、抽出された概念の上位概念を概念辞書111に基づいて抽出し、関連語と上位概念とこれらの概念の繋がりとから構成される部分木20を作成する部分木作成手段102と、概念の繋がりの形態に対応付けられた係数基づいて、関連度から上位概念のスコアを計算する関連度計算手段103と、上位スコアを有する上位概念を出力する概念出力手段104とを有する。 (もっと読む)


101 - 110 / 543