説明

Fターム[5B091CA21]の内容

機械翻訳 (6,566) | 言語処理技術 (1,358) | 変換・文生成 (261)

Fターム[5B091CA21]の下位に属するFターム

Fターム[5B091CA21]に分類される特許

21 - 40 / 152


【課題】複数の相手から同一の文章情報が与えられた場合においても、画一的にならない文章情報を作成できるようにする。
【解決手段】サーバ装置20の制御部21は、ホスト利用者とゲスト利用者のアクセス数を算出する。次に、制御部21は、ホスト利用者とゲスト利用者の親密度を特定する。次に、制御部21は、ホスト利用者の投稿した日記情報を解析して話題を特定する。次に、制御部21は、ホスト利用者の投稿した日記情報に応じた嗜好度を特定する。この嗜好度とは、コメント投稿者が日記投稿者の投稿した日記情報に対して示す興味の程度を示すものであり、日記情報が属する話題と、コメント投稿者と日記投稿者の親密度とで一意に決まるものである。次に、制御部21は、嗜好度に応じた字句の表現を特定する。以上により、サーバ装置20の制御部21は、特定した嗜好度に応じて語句の表現を異ならせた応答情報を投稿することが可能となる。 (もっと読む)


【課題】不要な変形規則を含まず、難解単語から平易単語への変形規則のみを自動的に獲得することのできる文書平易化装置および平易化規則テーブル作成装置を提供する。
【解決手段】平易化規則テーブル作成装置内では、置換可能単語対作成部が、辞書テーブル記憶部から読み出した単語と語釈文に基づき置換可能単語対として出力する。平易化規則候補認定部は、置換可能単語対に含まれる単語それぞれについて難易度データを読み出し、置換可能単語対が平易化規則となり得るか否かを認定する。文脈類似認定部は、置換可能単語対に含まれる単語に基づいて文脈類似データベース記憶部を読み出し、置換可能単語対に含まれる単語同士が文脈類似な関係にあるか否かを認定する。平易化規則テーブル書込部は、平易化規則候補認定部によって平易化規則となり得ると認定され且つ文脈類似認定部によって文脈類似な関係にあると認定された平易化規則を生成する。 (もっと読む)


【課題】自然言語処理において文情報の中心となる述部を、その意味を出来るだけ変えずに最も単純な形に変換すること。
【解決手段】形態素解析部2で解析され、述部抽出部3で抽出された入力文の述部に対応する形態素毎の単語情報に対し、意味ラベル付与部4において、述部の意味に影響を与える機能表現の意味を表す意味ラベルと、各意味ラベルに対応する機能表現のリストとを少なくとも組み合わせてなる機能表現意味ラベル辞書1を用いて、機能表現を構成する機能語列の単語情報に意味ラベルを付与し、当該意味ラベルに従ってNULL削除部5及び冗長ルール適用部6において述部の意味に影響を与えない機能語及び冗長な機能語を削除し、活用生成部7で残りの入力文の述部に対応する形態素毎の単語情報に基づき、入力文の述部を生成する。 (もっと読む)


【課題】構文解析技術を用いることなく、自然文から構造化された情報を抽出する技術の提供。
【解決手段】企業名、企業活動、活動対象物を示す具体的な表現文字列毎にその種類を示す抽象化文字列を登録した辞書記憶部26と、文を形態素単位に分解し、各形態素に対応の抽象化タグを関連付ける形態素解析処理部12と、企業活動の抽象化タグが付与された形態素を文の述語と認定すると共に、主語に付属する助詞毎及び目的語に付属する助詞毎に対応語の格納欄が設けられた格スロットに、文の述語単位で対応語を充填し、述語を関連付ける格スロット充填処理部20と、抽出すべき主語の抽象化タグ及び助詞を特定する条件と、抽出すべき述語の抽象化タグを特定する条件と、抽出すべき目的語の抽象化タグ及び助詞を特定する条件が規定された抽出フレーム定義を、対応語充填済みの格スロットに適用し、文の主語、述語、目的語に該当する情報要素を抽出する情報抽出処理部22を備えた情報抽出システム10。 (もっと読む)


【課題】
何時でも何処でももっと手軽に効率よく、付加価値の高い検索用文データを記述する方法と、この手段を備えた情報処理装置、情報処理システムを提供する。
【解決方法】
(1)想定される時空間に関する文記述上の定義を行い、指定したこの時空間情報と、記述した文と、を連結することにより、任意の時空間に文字情報の付与を可能にする、任意の時空間で文字情報の付与を可能にする、既に出来上がっている文に時空間情報を付与可能とする。
(2)文記述者の活動空間を定義して、この活動時時空間に特有な語彙を登録した辞書を利用して文字入力をする。
(3)文構造を標準化、共通データ化するための文体構造を提供する。
(4)記述した文データを検索して任意の時空間の文を検出する、任意の時空間に存在する記述内容を検出する。
(5)以上(1)から(4)までを実現するための装置、システム構成を提供する。 (もっと読む)


【課題】ユーザの発話内容を事前に予測し、先取りしてシステムが発話可能な技術を提供する。
【解決手段】発話DB3には、対話DB2の収録データから抽出された各ユーザの発話表現が格納されている。テーブル作成部11は、発話DB3の格納データに基づき各ユーザの評価頻度のテーブル16を作成する。ユーザ類似度算出部12は、テーブル16の各ユーザの評価表現からユーザ間類似度を算出する。テーブル作成部13は、テーブル16の評価頻度を前記類似度で重み付けて、予測するユーザの各対象に対する評価頻度を見積もるテーブル17を作成する。発話決定部15は、テーブル17の評価頻度のランキング上位を予測対象に対する発話内容と決定する。この予測対象を予測精度推定部14の算出する各対象の頻度分布に応じて絞り込んでもよい。 (もっと読む)


【課題】本発明の課題は、問い合わせに回答すべく担当者が、問い合せの電子メールに対して妥当な回答を効率良く作成することで、担当者の作業負荷を軽減するとともに誤った回答文書を作成することを抑止することを課題とする。
【解決手段】上記課題を解決するために、本発明に係る回答支援システムは、問い合わせに回答すべく担当者が、電子メールで受け取った問い合わせが表示(ステップS200及びステップS201)された問い合せ内容確認画面500を用いて、回答文書の作成対象を選択し(ステップS203)、回答作成画面600を用いて回答文書を作成し(ステップS204、ステップS205)、回答内容に対して管理者に承認依頼を行った後(ステップS207〜ステップS209)、承認された回答文書を返信メールとして送信する(ステップS211)。 (もっと読む)


【課題】文書データから文をより適切に抽出することを目的とする。
【解決手段】情報処理装置が、文字列データが含まれる複数のオブジェクトに係る文書データから、複数のオブジェクトの各々に含まれる文字列データと、複数のオブジェクトの各々を解析して得る解析結果情報とを抽出し、抽出した文字列データの各々を文の区切り毎に分割する処理を行い、分割する処理を行った後のデータを断片データとして抽出し、抽出した解析結果情報に基づいて抽出した断片データの各々を結合するか否かを判別し、結合すると判別した断片データの各々を結合することによって課題を解決する。 (もっと読む)


【課題】既存のプログラムを大幅に修正することなく、外部表示される文字列情報を変更する。
【解決手段】情報処理装置10は、表示部14と、表示される文字列情報が埋め込まれたプログラムソースから作成されたアプリケーションプログラムが稼動するアプリケーション稼動部12と、アプリケーションプログラムの稼動中に文字列情報を表示するべき状態となった場合、情報処理装置10における現在の状況情報に応じて上記文字列情報を変換し、変換後の文字列情報を変換前の文字列情報と差し替え、表示部14に表示させる文字列変換部13と、を備えている。 (もっと読む)


【課題】迅速に多国語への通訳を行うことができるコード基盤多国語通訳装置及び方法を提供する。
【解決手段】各国言語に共通する意思伝達のための単語や簡単な慣用文をコードで定義した後、各国の言語をコードにマッピングして迅速に多国語を通訳できるコード基盤多国語通訳装置及び方法を提供する。この装置はコードを基準に自国語単語と慣用文が他国語単語と慣用文にマッピングされている多国語標準データベースと、自国語を音声認識する自国語音声認識器と、自国語音声認識器で認識された自国語を受信して対応するコードを検索し、検索されたコードに対応する他国語を探して出力する通訳検索エンジンと、通訳検索エンジンから受信した他国語が慣用文であればそのまま出力し、複数の単語であれば自国語の語順を他国語の語順に変換して変換された他国語文章を出力する語順変換器と、音声出力手段と、ディスプレイ手段とで構成される。 (もっと読む)


【課題】実際に発生した環境変化のうち、有用性のある環境変化に関する因果関係を示すストーリー文を、少ないユーザ負担で生成する。
【解決手段】非日常イベント判定部13により、新たな検知イベントの発生状況データに関する時系列変化の特徴と、イベントDB12から取得した過去の同一時間窓において検知した過去イベントの発生状況データに関する時系列変化の特徴との一致性に基づいて、非日常イベントを選択し、質問生成部21により、選択した非日常イベントと相関のある過去イベントのイベント情報から、これら過去イベントを回答候補とした質問データを生成し、質問処理部23により、質問データに対するユーザからの回答から、非日常イベントの発生原因となる原因イベントを特定して、当該原因イベントと非日常イベントの説明文を生成し、ストーリー生成部26により、これら説明文からストーリー文を生成する。 (もっと読む)


【課題】一般化された巡回セールスマン問題としてのフレーズ−ベースの統計的機械翻訳を行う。
【解決手段】統計的機械翻訳(SMT)および一般化された非対称巡回セールスマン問題(GTSP)グラフを使用して2つの言語を翻訳する方法は、SMT問題をGTSPとして定義するステップ(120)と、入力文のブロックを、前記GTSPを表すGTSPグラフ内のノードに対応するバイ−フレーズを使用して翻訳するステップ(122)と、前記GTSPを解くステップ(124)と、前記GTSPの解によって定義される順序で前記翻訳済みブロックを出力するステップ(126)と、を包含する。 (もっと読む)


【課題】漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列を自国語の発音列に変換することによって、最終的に導き出される自国語の発音列の精度を向上するシステムおよび方法を提供する。
【解決手段】統計的な方法を用いた漢字に対する自国語の発音列変換システムおよび方法が開示される。自国語の発音列変換システムは、漢字文字列に対して自国語の発音列を抽出する自国語の発音列抽出部、漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列に対する統計データを決定する統計データ決定部と、抽出された自国語の発音列と決定された統計データとを用いて漢字文字列を最適な自国語の発音列に変換する自国語の発音列変換部と、を含んでもよい。 (もっと読む)


【課題】柔軟で精度の高い統計翻訳技術の特徴を維持しつつ,新規の情報に対して拡張容易な統計翻訳技術を実現する。
【解決手段】対訳コーパス101中における原言語文および目標言語文において,単語辞書にあらかじめ登録されている単語の箇所を変数として置き換えた変数化対訳コーパス105を生成し,生成した対訳コーパスを用いて翻訳モデル107および言語モデル108を学習する。入力文についても,入力文内変数化部111で単語辞書103に登録されている単語を変数に置き換えた後,上述の学習したモデルを用いて統計翻訳部113で翻訳を行う。変数置換部114は、入力文中の単語を変数に置き換えた際の情報と単語辞書に基づいて,翻訳結果に中に含まれる変数を目標言語の単語に置き換えた結果を最終的な翻訳結果として出力する。 (もっと読む)


【課題】ユーザの対話意欲を促進させることができる応答を可能にする。
【解決手段】本発明に係る対話処理装置1は、ユーザの音声を認識する音声認識部2と、音声認識手段2による認識結果に基づいて、ユーザが発話した発話文の少なくとも係り受け関係を解析する構文解析部3と、構文解析手段3により解析された係り受け関係に関する情報を、ユーザの発話の進行に伴い蓄積していく係り受け関係記憶手段4と、係り受け関係記憶手段4に蓄積された係り受け関係に関する情報に基づいて、発話文の内容を纏めた纏め文を生成する応答生成手段6とを備える。 (もっと読む)


【課題】利用者からの検索要求文に基づいて適切な検索結果を得ることを可能とする。
【解決手段】入力処理部31は、検索要求文を入力する。構文解析部32は、検索要求文の構文解析結果を検索要求文解析結果格納部22に格納する。一次検索部33は、検索要求文に含まれる自立語を含む検索対象文を検索する。部分検索要求生成部34は、言い換えパタン格納部24を参照して検索要求文の部分検索要求文を生成する。言い換え検索部35は、言い換えパタン格納部24を参照して検索された検索対象文の言い換え文を生成する。言い換え検索部35は、部分検索要求文および検索対象文の言い換え文が類似するかを判定する。検索結果決定部36は、部分検索要求文および検索対象文の言い換え文が類似すると判定された場合、一次検索部33によって検索された検索対象文を検索要求文に対する検索結果として決定する。 (もっと読む)


【課題】オノマトペの客観的なイメージの情報を提示するオノマトペのイメージ評価システム、イメージ評価装置、およびイメージ評価用プログラムを提供する。
【解決手段】評価処理対象のオノマトペの音韻形態を解析する音韻形態解析部41と、解析された各音韻形態のイメージを示す語句を定性的なイメージ評価情報として取得する定性イメージ評価部42と、定性的なイメージ評価情報から当該オノマトペのイメージを示す文書情報を生成する文書情報生成部43と、解析された各音韻形態の予め設定された形容詞ごとのイメージ評価値を特定し、これに基づいて当該オノマトペのイメージ評価値を当該オノマトペの定量的なイメージ評価情報として算出する定量イメージ評価部44と、当該オノマトペのイメージを示す文書情報と定量的なイメージ評価情報とを、当該オノマトペの評価情報として出力するための出力情報を生成する出力情報生成部45とを有する。 (もっと読む)


【課題】 従来の自動応答文生成は,インターネット上の掲示板やブログ,チャットなど,利用者がどのような事項に対する対話を行うか不明確であるとともに,対話が進むにつれ話題が変化することもしばしばあるため,あらかじめ応答文もしくは応答すべき事項の知識を準備することは不可能であり,しばしば,まったく整合性のない応答文が生成されるという問題が生じていた.
【解決手段】 人間が発信した言語情報からキーワードを抽出し,このキーワードに対してインターネットにおけるWeb上の情報を収集しキーワードを補完し,これらのキーワードに対して分野連想語辞書を照合することで,まず人間が発信した言語情報がどのような話題の言語情報であるかを確定する.その後,人間が発信した言語情報から抽出したキーワードおよびその分野情報と応答文の雛形となる文テンプレートから文生成を行うことで,不特定の話題であっても話題に対して適切な応答文を生成することを特徴とする. (もっと読む)


【課題】複数のユーザのそれぞれに対して、翻訳された文章の内容を容易に理解させること。
【解決手段】文章変換システムは、複数の語句のそれぞれに対応付けて、当該語句をイメージさせる語句イメージ画像を格納する語句画像格納部と、文章を取得する文章取得部と、文章取得部が取得した文章に含まれる複数の語句のそれぞれの、文章における役割を判断する役割判断部と、文章取得部が取得した文章に含まれる複数の語句のそれぞれについて、当該語句に対応付けられている語句イメージ画像を語句画像格納部から取得する語句画像取得部と、語句画像取得部が取得した複数の語句イメージ画像のそれぞれが、役割判断部が判断した役割に応じた位置に配置された、文章の内容をイメージさせる文章イメージ画像を生成する文章画像生成部とを備える。 (もっと読む)


【課題】ソフトウェアのドキュメントの翻訳に好適な翻訳装置、方法、及びプログラムを提供する。
【解決手段】ソフトウェアのソースコードを記憶するソースコード記憶部32と、ソースコードの仕様が記載されたドキュメントを原言語で生成する生成部45と、生成されたドキュメントを記憶するドキュメント記憶部34と、ドキュメント記憶部からドキュメントを取得するとともに、ドキュメントの生成元のソースコードをソースコード記憶部から取得する取得部50と、取得されたソースコードを参照して、取得されたドキュメントからソースコード中に出現するプログラム要素を検出する検出部60と、検出されたプログラム要素を、目的言語への翻訳が不要な翻訳不用語句に設定する設定部70と、ドキュメントの翻訳不要語句以外の語句を目的言語に翻訳する翻訳部80と、ドキュメントの翻訳結果を出力する出力部20と、を備える。 (もっと読む)


21 - 40 / 152