説明

国際特許分類[G06F17/27]の内容

物理学 (1,541,580) | 計算;計数 (381,677) | 電気的デジタルデータ処理 (228,215) | 特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法 (34,028) | 自然言語データの取扱い (7,890) | 自動言語解析,例.構文解析,綴字訂正 (543)

国際特許分類[G06F17/27]に分類される特許

31 - 40 / 543


【課題】計算コストの増大を抑制しつつ、高精度な分類精度を得られる解析モデルを学習する。
【解決手段】ベースライン解析部2で、解析対象、基本特徴量、及び正解を含む複数の訓練用サンプル各々に対して、解析結果の予測値を解析し、ルール候補作成部4で、解析誤りのある訓練用サンプルからルールテンプレート5に従って変換ルール候補を作成し、ルール選択部6で、変換ルール候補各々を適用した場合に、正味の正解増加数が最大となる変換ルール候補を選択し、ルール適用部8で、選択した変換ルールを全訓練用サンプルに適用し、解析誤りが0になるまでルールの生成及び適用を繰り返す。インデクス作成部10で、各訓練用サンプルに適用されたルールの履歴及び基本特徴量のインデクスを格納し、訓練ベクトル作成部12で、インデクスに基づいて訓練ベクトルを作成し、学習部14で、訓練ベクトルに基づいて解析モデルを学習する。 (もっと読む)


【課題】第1言語の文書の原文が構文解析に失敗した場合でも、ユーザに負担を課すことなく読みやすい訳文を生成できるとともに、開発者による機械翻訳のチューニングの効率化や省力化を図ることである。
【解決手段】文書解析手段30は、第1言語で表現された文書の各原文を構文解析する。訳文生成手段33は、文書解析手段30で構文解析に成功したときは原文の訳文を生成する。第1言語単語除去手段34は、文書解析手段30で構文解析に失敗したときは原文から1単語を除去した単語列を作成する。また、文書解析手段30は、第1言語単語除去手段34で得られた1単語を除去した単語列を構文解析し、訳文生成手段33は、1単語を除去した単語列の構文解析に成功したときはその単語列の訳文を生成し、1単語を除去した単語列の構文解析に失敗したときは原文の不完全な訳文を生成する。 (もっと読む)


【課題】モデルの要素集合Θのパラメータ要素をその重要度順に配列するモデルパラメータ配列装置を提供する。
【解決手段】初期化部は、選択サブセット候補を空集合で初期化して集合Θと選択サブセット候補を出力する。要素選択部は、集合Θと選択サブセット候補を入力として、サブセット候補として選択サブセット候補と他のパラメータ要素との全ての組を出力する。サブセット評価値記憶部は、サブセット候補を入力として、当該サブセット候補のそれぞれのスコアEの最大値若しくは最小値と、上記集合Θのスコア値である評価値Eとの差分を求め、その差分が最小若しくは最大となるサブセット候補を選択サブセット候補として記憶する。 (もっと読む)


【課題】大量の文書の中から薀蓄文を抽出する。
【解決手段】本開示の情報処理装置は、収集された1以上の文章から成る文書をトピック解析することにより、前記文書を成す各文章に対して、ローカルトピックの各項目に対する適合の程度を示す確率を算出し、収集された前記文書を言語解析することにより、ローカルトピックの項目毎に特有の言い回しパターンを検出し、収集された前記文書を成す各文章に対する評価者の評価に基づいて各文章に対するトピック有用度を設定し、トピック解析結果と前記トピック有用度に基づき、ローカルトピックの各項目に対して合計評価値を設定し、前記合計評価値に基づいてローカルトピックの項目を選別し、選別したローカルトピックの項目に特有の言い回しパターンに適合する文章を、収集された文書から薀蓄文候補として抽出する。 (もっと読む)


【課題】一般的な教師あり学習に用いられる素性よりも、コンパクトかつ高精度の縮約素性を生成する。
【解決手段】原素性重要度計算部141で、ベースモデル構築部12により正解データから学習して構築されたベースモデル22と未解析データ24とを用いて、未解析データ24の入力に対するベースモデル22の最尤出力に対して、未解析データから抽出された原素性各々が与える影響を示す重要度を、複数の原素性各々について計算する。原素性選択部142で、重要度が0の原素性を排除して、残りの原素性を選択する。原素性融合部143で、選択した原素性集合から、同じ重要度となる原素性を一つの縮約素性としてまとめ上げて、縮約素性集合を生成する。原素性重要度追加部144で、原素性の重要度に関する素性を生成して、縮約素性集合に追加する。 (もっと読む)


【課題】作業内容を説明した文書から、実際に作業者が行う作業のうち適切な作業を抽出する。
【解決手段】文書処理方法は、作業内容を説明した第1文書データを格納する第1DBから、動詞又はサ変名詞を含む自立語のうち、当該自立語に係る主語が無いという条件を満たす自立語を抽出し第1データ格納部に格納する工程と、作業内容を第1文書データより詳細に説明した第2文書データを格納する第2DBから、動詞又はサ変名詞を含む自立語のうち、上記条件を満たす自立語を抽出し第2データ格納部に格納する工程と、第1データ格納部に格納されておらず且つ第2データ格納部に格納されている自立語と、抽出すべきでない自立語を格納する第3データ格納部に格納されている自立語とを、第1及び第2データ格納部に格納されている自立語の集合から除外し、当該自立語の集合における残余の自立語を第4データ格納部に格納する工程とを含む。 (もっと読む)


【課題】オンライン辞書について辞書管理の負担を軽減させた高品質な類似検索機能を提供する。
【解決手段】類似検索部3は、辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する。主要部特定部4は、類似検索手段で特定された類似表記と入力表記との共通部分を特定し、特定された共通部分が主要部辞書に存在すれば、該共通部分を主要部候補と判定する。この主要部候補を類似表記から除外した付加部候補が付加部辞書に存在するか否かを判定し、判定結果に応じて主要部候補を主要部と確定する。距離算出部5は、確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する。更新確認部6は、算出された編集距離順に類似表記・主要部・付加部を辞書管理者に提示する。 (もっと読む)


【課題】感情語辞書を事前に用意する必要がなく、怒り感情を頑健に推定可能とする。
【解決手段】対話テキストを話者別のテキストに分割する話者分割処理部11と、分割された話者別のテキストの形態素を解析し、各話者別のテキストを形態素単位に分割した形態素解析結果を出力する形態素解析処理部12と、形態素解析結果を用い、話者別のテキスト中の同じ内容語の出現頻度を表す指標である発話内容冗長性特徴量を、各話者別のテキストに対して求める発話内容冗長性特徴量抽出部13と、形態素解析結果を用い、話者別のテキスト中の内容語の出現頻度を表す指標である発話内容情報性特徴量を、各話者別のテキストに対して求める発話内容情報性特徴量抽出部14と、予め学習した感情識別器30を用い、発話内容冗長性特徴量及び発話内容情報性特徴量の少なくとも一方を用いて対話テキストの対話が怒り対話か否かを推定する感情識別部20とを具備する。 (もっと読む)


【課題】膨大な量の電子メールの中から、必要としている情報を迅速に探し出すことができる電子メール情報表示システムを提供する。
【解決手段】電子メール情報表示システムのクライアントPC101は、ヘッダ情報に基づき、任意の電子メールに対して、送信、受信、返信、および転送を含む電子メールの一連のやり取りの流れを構築し、表示する手段と、一連のやり取りの流れが構築された任意の電子メールを含んだ、一連のやり取りの流れに含まれる全ての電子メールに対して、本文に含まれる文章の各行に対し、引用符「>」の抽出と文章の形態素解析を行う手段と、その結果により、各電子メール本文に含まれるキーワード群と各キーワードに付与されていた引用符数を抽出し、電子メールの一連のやり取りの中での重要キーワードを決定する手段と、電子メールの一連のやり取りの流れと、当該重要キーワードとを表示する手段等を備える。 (もっと読む)


【課題】入力自然文の意味を表現する意味構造を構築し、その意味構造を細分化し、その細分化した意味構造から自然文を生成し、自然文の細部の意味を提示する。
【解決手段】
入力自然文に形態素解析や構文解析を行い、その解析結果に意味構築処理を行って、部分的な意味構造を構築し、部分的な意味構造を意味根で結合しながら、入力自然文の全体の意味構造を構築する。その意味構造を意味根で細分化して、細分化した当該意味構造から自然文を生成して明示すると入力自然文の意味が細部にまで検証できる。
書き手は、文法と知識を用いて文を作成するが、読み手も書き手と同じ知識を共有するとはかぎらない。本発明では、知識を持たない読み手の立場に立ち、主に文法情報だけで意味解析する。それによって、知識を持たない読み手でも精確に理解できる文を書き手が作成できるように支援する。そのような文作成支援自然文処理法。 (もっと読む)


31 - 40 / 543