説明

Fターム[5B091AA11]の内容

機械翻訳 (6,566) | 言語 (1,300) | 1言語間 (116)

Fターム[5B091AA11]の下位に属するFターム

Fターム[5B091AA11]に分類される特許

1 - 20 / 109


【課題】本発明の実施形態が解決する課題は、複数の形態素単位で同義語変換を行なう自然言語処理装置を提供することである。
【解決手段】
実施形態の自然言語処理装置は、同義語と同義語変換対象語とが対応付けられた同義語辞書を記憶する記憶部と、文書データを形態素解析する形態素解析部と、形態素解析の結果と同義語辞書とを用いて、形態素解析の結果に含まれる形態素のうち、連続する複数の形態素が同義語変換対象語と一致するかを判定し、一致すると判定した同義語変換対象語を対応する同義語に変換する同義語変換部と、を備える。 (もっと読む)


【課題】 曖昧語を含む文書について、各使用場面で曖昧語が文書の品質に与える影響の大きさを考慮して、精度よく文書の優先的な修正点や品質を推定する技術を提供する。
【解決手段】 本発明における文書分析システムは、外部から入力された文書を構成する文章に使用されている各単語の単語情報に基づいて、文書中における曖昧語を検索し、曖昧語が有る場合は当該曖昧語を抽出する曖昧語検索部と、推定鍵語を抽出するための推定鍵語抽出ルールに基づいて、文書から各曖昧語に対するそれぞれの推定鍵語を抽出する推定鍵語抽出部と、概念規模推定ルールに基づいて、推定鍵語抽出部で抽出された推定鍵語の概念の規模である概念規模指標を推定する概念規模推定部と、概念規模指標に基づいて、各曖昧語と推定鍵語との組合せ毎に曖昧性情報を算出する曖昧性算出部と、を含む。 (もっと読む)


【課題】大規模な書き言葉コーパスを相槌を含む大規模なコーパスに変換すること。
【解決手段】コーパス変換装置100は、相槌を含む学習コーパス10の文を取得する学習コーパス取得部110と、コーパス取得部110で取得した文に基づいて、文長毎に、文中の各位置の相槌の出現確率を算出する出現位置確率算出部120と、算出した出現確率を文長および文中の位置に対応つけて記憶する出現位置確率記憶部130と、学習コーパス取得部110で取得した文に基づいて、相槌の種別毎に、文中の各位置の相槌の出現確率を算出する出現種別確率算出部140と、算出した出現確率を相槌の種別および文中の位置に対応つけて記憶する出現種別確率記憶部150と、出現位置確率記憶部130と出現種別確率記憶部150とに基づいて、大規模コーパス30の文に相槌を挿入し、相槌を含む大規模なコーパスを構築する変換手段と、を備える。 (もっと読む)


【課題】同形異音異義語の漢字と関連付けられるピンインに対して望ましくない中国語変換候補を生成しない方法及び装置を提供する。
【解決手段】言語変換において複数の読み方の曖昧性を除去することが開示される。これは、対象記号系での入力データの記号表現を含む文字の集合に変換される入力データを受信することと、対象記号系の同形異音異義語の文字が入力データの対応する一部分を表すために使用されるべきである確率を判定するために文字の第1の読み方と第2の読み方とを区別する言語モデルを使用することとを含む。 (もっと読む)


【課題】換喩を考慮せずに格要素が記述された格フレーム辞書を用いた場合であっても、文に換喩が含まれるか否かを判定する換喩判定プログラム及び情報処理装置を提供する。
【解決手段】情報処理装置1は、文から動詞及び当該動詞の格要素を抽出する換喩判定対象抽出手段101と、格フレーム情報111から、抽出した動詞と動詞の格要素の少なくとも1つとが一致する格フレームを検索する格フレーム検索手段102と、検索した格フレームのうち抽出した動詞と動詞の格要素とが一致する数の最も多い格フレームを基本格フレームとし、他の格フレームと比較する格フレーム比較手段103と、基本格フレームと他の格フレームとで一致しない格に含まれる格要素どうしから予め定めた方法で用例を生成し、当該用例が換喩判定用情報112に予め定めた頻度で出現する場合、文に換喩が含まれると判定する換喩判定手段104とを有する。 (もっと読む)


【課題】契約書に含まれる文章の危険度を判定し契約書のチェックを支援する契約チェック支援装置を提供する。
【解決手段】文章分解部12が、契約書データ格納部2に格納された契約書データ21に含まれる文章の各々を分解して、文章に含まれる目的語、述語及び修飾語を抽出すると、文章分解部12が抽出した目的語と述語との組合せが注意目的語/注意述語組合せテーブル24に存在し、文章分解部12が抽出した修飾語が注意修飾語/危険度テーブル25に存在する場合に、危険判定部13が、注意修飾語/危険度テーブル25から修飾語に対応する危険度を求める。 (もっと読む)


【課題】 一般人が携行可能なサイズに構成されたクライアント端末装置を利用することによって、異言語を母国語とする人同士におけるコミュニケーションを円滑にするための意思疎通支援システム、及び、この意思疎通支援システムを発展させたものであって、特に、クライアント端末装置の利用者と医師や医療機関との連絡を支援するためのシステムを提供することを目的とする。
【解決手段】 クライアント端末装置のディスプレイにおいては、異言語を母国語とする人同士におけるコミュニケーションを開始する場合おいて、「事故/犯罪」「交通」「案内/確認」等、特に、頻度が高いと思われる内容をイラスト及び日本語表記と共に示した複数のアイコンが表示されている。 (もっと読む)


【課題】変換対象の単語を修飾する修飾句をも考慮しながら、名詞から動詞等へ、異なる品詞間での単語変換を行うことによって、自動的に文を平易化する。
【解決手段】平易化規則選択部は、係り受け解析結果データに含まれる名詞データに基づき、平易化規則テーブル記憶部から適用可能な前記平易化規則データを選択する。修飾句変換規則選択部は、平易化規則データが適用され得る名詞データを修飾する連体修飾句データを抽出し、修飾句変換規則データを選択する。格フレーム照合部は、平易化規則データに含まれる用言データと、選択された修飾句変換規則データに含まれる連用修飾句データとに基づき、格フレームテーブル記憶部から出現頻度データを読み出し、出現頻度に基づいて表現の置換を行う。体言変換規則選択部は、自立語に合う体言化データを選択し、用言データを体言化する。 (もっと読む)


【課題】 係り受け構造を有する照会パターンに対する文のマッチング・スコアを演算すること。
【解決手段】 本発明の情報処理装置100は、解析対象の文150と、照会パターン160と、上記文内の言語単位間の係り易さを指標する指標値170とを入力として取得する入力部110と、文が照会パターンにマッチする程度を指標するマッチングのスコアを、上記照会パターン160に含まれる各係り受け関係が対応付けられる各指標値を少なくとも変数とする関数で表して演算するスコア演算部120とを含む。スコア演算部120は、上記照会パターンの部分構造と文の範囲との対応付けを試行して、上記関数の部分演算結果を、再利用するため記憶領域130に格納しながら、この部分構造および範囲の内部に関して再帰的に演算することによって、上記スコアを算出する。 (もっと読む)


【課題】入力された日本語の発話文に対し、敬語の誤用の有無を柔軟に判定できるプログラム及び装置を提供する。
【解決手段】発話文テキスト、発話文に関わる人物と人物間の社会的関係を示す人間関係ラベル、難易度の入力を受け付け、発話文テキストに対する形態素解析や構文解析を行い、発話文中の主語及び補語、文末表現、述語について敬語特徴量として数値化するとともに、発話文に関わる人数に依らず汎化した規範ルールを参照して発話文中の主語及び補語と人間関係ラベルに該当する規範ルールを特定し、各規範ルールについて現代の一般の人々の敬語規範意識に基づく正誤の妥当性を数値化した妥当性の程度の値と難易度とを比較することで、判定に用いるべき規範ルールを定め、その規範ルールで正しいとされる敬語特徴量と発話文テキストに用いられた敬語特徴量とを対比することで、発話文テキスト中の敬語の正誤判定を実行できるようにした。 (もっと読む)


【課題】文書が具体主題を有するか否かを判定する。
【解決手段】名詞句抽出部12で、具体主題の候補となる名詞句を抽出し、意味カテゴリ付与部18で、名詞句各々に意味カテゴリを付与し、エントロピー算出部20で、付与された意味カテゴリの偏りを示すエントロピーを第1の素性として算出する。また、視覚的特徴算出部24で、入力された文書が縦長か横長かを示す第2の素性を算出する。素性ベクトル生成部26で、第1の素性及び第2の素性を並べた素性ベクトルを生成し、具体主題が既知の学習用文書の素性ベクトルを用いて学習された分類器に入力して、入力された文書が具体主題を有するか否かを判定する。 (もっと読む)


【課題】文書から主題を抽出する。
【解決手段】名詞句抽出部12で、具体主題の候補となる名詞句を抽出し、名詞句ペア作成部14で、名詞句ペアを作成する。名詞句頻度抽出部18で、名詞句各々の出現頻度、及び名詞句ペア各々の共起頻度を抽出し、出現確率勝敗算出部20で、名詞句各々の出現頻度及び名詞句ペアの共起頻度から求まる名詞句各々の出現確率を求め、名詞句ペアで出現確率に基づく勝敗を示す第1の素性を算出する。また、係り受け構造抽出部22で、名詞句ペアの係り受け構造毎の出現頻度を抽出し、係り受け関係勝敗算出部24で、名詞句ペアで係り先になり易さによる勝敗を示す第2の素性を算出する。素性ベクトル生成部26で、第1の素性及び第2の素性を並べた素性ベクトルを生成し、具体主題が既知の学習用文書に含まれる名詞句の素性ベクトルを用いて学習された分類器に入力して、具体主題を示す名詞句を抽出する。 (もっと読む)


【課題】曖昧文を検出する際に、過剰検出や不適切な指摘内容の発生を低減させ、曖昧文の検出精度を向上できる。
【解決手段】実施形態の構文解析手段は、前記入力を受け付けた文を構文解析し、構文解析結果を得る。実施形態の抽出手段は、この構文解析結果に基づいて、前記場合に該当する文の構文解析結果から係り受け元、複数の係り受け先を含む係り受け情報を抽出する。実施形態の関係情報補正手段は、前記構文解析結果及び前記関係情報補正ルールに基づいて、前記係り受け情報が前記第1乃至第4の関係のいずれかに該当するか否かを検査すし、該当する係り受け情報に対して、前記関係情報補正ルールに規定された補正処理を行う。実施形態の指摘情報生成手段は、前記関係情報補正手段による処理の結果に基づいて、前記第1乃至第4の関係のいずれにも該当しないとき、前記曖昧文である旨を指摘する指摘情報を生成し、この指摘情報を出力する。 (もっと読む)


【課題】同じ表層形を持つ機能表現が複数存在していても、形態素列に適切な意味ラベルを選択する。
【解決手段】本発明の素性重み学習装置と機能表現解析装置は、ラティス構築手段と最尤パス探索手段とを有するデコーディング部を備える。ラティス構築手段は、入力された形態素列に対して、意味ラベルが付与されたフレーズラティスを作成する。フレーズラティスは、機能表現辞書と形態素列表記が一致するフレーズ、機能語に分類される品詞を持つ形態素のフレーズ、述語に分類される品詞を持つ形態素のフレーズ、述語および機能表現ではないことを示す形態素のフレーズを含む。最尤パス探索手段は、素性に対する重みを格納したパラメータテーブルを用いてフレーズラティスから尤もらしいパスである最尤パスを探索する。素性には、形態素列と意味ラベルを対応つける素性と意味ラベル列を表す素性の両方が含まれる。 (もっと読む)


【課題】事前に与えた基準を守りつつ、それと異なる新しい文字列又は記号列を高精度に分割する。
【解決手段】識別モデルパラメータ更新部25によって、NPYLMをCRFに変換し、変換したCRFの各エッジの重みと、CRFにおける対応するエッジの重みとを用いて第1の統合モデルを作成し、第1の統合モデルを、教師ありデータに基づいて学習する。生成モデルパラメータ更新部26によって、CRFをSemi−Markov CRFに変換し、Semi−Markov CRFの各エッジの重みとNPYLMの対応するエッジの重みとを用いて第2の統合モデルを作成し、第2の統合モデルを、教師なしデータに基づいて学習する。収束判定部27によって所定の収束条件を満たしたと判定されるまで、識別モデルパラメータ更新部25による更新と生成モデルパラメータ更新部26による更新とを交互に繰り返す。 (もっと読む)


【課題】各種システムやソフトウェアに対する顧客からの要求をより確実に獲得することができる要求獲得支援装置を提供する。
【解決手段】要求獲得支援装置として、ヒアリング案件に関する要求関連文書データを入力する情報登録手段と、要求関連文書データ文章中の多義的に捉えられ得る曖昧ポイントを抽出し、抽出した個々の曖昧ポイントについて曖昧性の特徴に基づく曖昧性の種類を示す曖昧性分類を決定する要求関連文章分析手段と、要求関連文書データの曖昧性をヒアリング実施者の立場から定量化して要件把握性として定義する要件把握性評価手段と、要求関連文書データにおける個々の曖昧ポイントについて、曖昧性分類と要件把握性に基づき分析して、質問に適したヒアリング時に提供するヒアリングアドバイスを候補から選択するヒアリングアドバイス分析手段と、選択されたヒアリングアドバイスを表示するヒアリングアドバイス表示手段とを設ける。 (もっと読む)


【課題】 目的語と述語が離れている文の検出精度を向上させる。
【解決手段】 実施形態の言語解析手段は、前記入力を受け付けた文を言語解析し、言語解析結果を得る。実施形態の抽出手段は、前記言語解析結果から前記文の目的語と述語を抽出する。実施形態の距離診断手段は、前記抽出された目的語と述語との前記文内での距離が予め設定された基準よりも大きいか否かを診断する。実施形態の述語省略診断手段は、前記距離診断手段による診断の結果、距離が大きい場合、前記抽出された目的語と前記言語解析手段による言語解析結果と前記述語省略診断ルールとに基づいて、当該目的語に対して述語が省略されている場合に該当するか否かを診断する。実施形態の第1の指摘情報生成手段は、前記述語省略診断手段による診断の結果、該当しない場合、前記目的語と前記述語とが離れている旨の指摘情報を生成し、この指摘情報を出力する。 (もっと読む)


【課題】文章の作成を適切に支援する技術を提供する。
【解決手段】文章生成装置10は、文の一部に取替部分を有するテンプレートを格納した管理テーブル60と、取替部分に代入すべき文字列をユーザから受け付ける際に、代入すべき文字列の内容を問う質問をユーザに提示する質問提示部42と、ユーザから受け付けた文字列を取替部分に代入したときに文の意味が通るようにするために、テンプレートにおける取替部分の前後の文脈に応じて、代入すべき文字列を入力するための領域の直前及び直後に直前文字列及び直後文字列をそれぞれ提示する前後文字列提示部44と、入力された文字列を取得して記録する記録部46とを備える。 (もっと読む)


【課題】 述語の省略を発見して作成者に修正を促すことを可能とする。
【解決手段】 実施形態の言語解析手段は、前記入力を受け付けた文を言語解析し、言語解析結果を得る。実施形態の構文関係検査手段は、この言語解析結果と前記格情報認識ルール及び前記構文関係検査ルールとに基づいて、前記要注意成分があるか否かを検査し、前記要注意成分がある場合には当該要注意成分を送出する。実施形態の述語省略診断手段は、前記入力を受け付けた文に対し、前記送出された要注意成分と前記言語解析手段による言語解析結果と前記述語省略診断ルールとに基づいて、当該要注意成分に対して述語が省略されている場合に該当するか否かを診断し、該当する場合には省略箇所を示す情報を送出する。実施形態の指摘情報生成手段は、前記送出された省略箇所を示す情報に基づいて、述語が省略されている旨を指摘する指摘情報を生成し、この指摘情報を出力する。 (もっと読む)


【課題】大規模データから出現頻度の高い複合語を抽出できる情報処理装置、複合語抽出方法、及び複合語抽出プログラムを提供する。
【解決手段】情報処理装置100は、大規模データから複合語を抽出する装置であって、大規模データに対して形態素解析を行い、解析結果として得た形態素及び/又は形態素の集合である形態素列の出現頻度値を算出し、算出した出現頻度値に基づき、複合語の候補となる文字群を抽出する候補抽出手段14と、抽出された文字群を所定の記憶領域に保持する文字群保持手段42と、文字群保持手段42に保持された文字群から、有効な複合語を判定するための条件を満たす文字群を、出現頻度の高い文字群として抽出する複合語抽出手段21と、を有することを特徴とする。 (もっと読む)


1 - 20 / 109