説明

Fターム[5B091AA11]の内容

機械翻訳 (6,566) | 言語 (1,300) | 1言語間 (116)

Fターム[5B091AA11]の下位に属するFターム

Fターム[5B091AA11]に分類される特許

41 - 60 / 109


【課題】単語・成分番号間共起に基づく手法において、対応する単語の間の意味的な類似性と識別性をより緻密に反映できる共起ベクトルまたは概念ベクトルを生成することを可能とする共起行列生成装置を提供する。
【解決手段】各行が単語に対応し、各列がN個の成分番号に対応している第1共起行列14を入力とし、該第1共起行列14の行ベクトルの集合をN´個のクラスタにクラスタリングして、単語とクラスタの成分番号を対応付ける第1クラスタリング手段11と、各行が、形態素解析されたテキストの単語に対応し、各列がN´個の成分番号に対応している第2共起行列17を生成する第2共起行列生成手段12と、任意の単語と任意の成分番号に対し、前記第1共起行列14と前記第2共起行列17の対応する要素を、線形結合した値を、対応する要素とする第3共起行列18を生成する第3共起行列生成手段13とを備える。 (もっと読む)


【課題】学習結果としてのn−gram言語モデルのデータ量を抑制し、効率的にアクセス可能な技術を提供する。
【解決手段】言語モデルの圧縮装置1は、言語モデル記憶部5にn−gram言語モデルを記憶する。データ構造変換部3は、言語モデル記憶部5に記憶されたn−gram言語モデルのデータ配列中、(n+1)−gramの最初の位置を示すポインタを固定バイト表現に変換し、変換データ記憶部6に記憶させる。ポインタ表現の圧縮部4は、変換データ記憶部6に記憶されたn−gram言語モデルの木構造に仮想的なルートノードを設けることでトライ(trie)と擬制し、前記ポインタをLOUDS表現に圧縮変換する。ここで圧縮変換されたデータを圧縮データ記憶部7に記憶させる。この記憶部7は、主に計算機の記憶装置(RAM)を用いる。 (もっと読む)


【課題】漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列を自国語の発音列に変換することによって、最終的に導き出される自国語の発音列の精度を向上するシステムおよび方法を提供する。
【解決手段】統計的な方法を用いた漢字に対する自国語の発音列変換システムおよび方法が開示される。自国語の発音列変換システムは、漢字文字列に対して自国語の発音列を抽出する自国語の発音列抽出部、漢字−自国語の発音列の変換との関連を特徴つける統計データを用いて漢字文字列に対する統計データを決定する統計データ決定部と、抽出された自国語の発音列と決定された統計データとを用いて漢字文字列を最適な自国語の発音列に変換する自国語の発音列変換部と、を含んでもよい。 (もっと読む)


【課題】意味内容は対応するが係り受け構造は異なる別の文への言い換えを実現するための情報処理装置を提供する。
【解決手段】互いに対応する意味を持つ2つの文から、互いに対応する文要素の組であって、一方は動詞を含み、他方は付属語を含む文要素の組を抽出し、抽出される文要素の組に基づいて、言い換え可能な動詞と付属語の対情報を出力する情報処理装置である。 (もっと読む)


【課題】言い換え生成規則の作成にかかっていたコストを削減することを可能とする。
【解決手段】解析部32は、入力文、言い換え前用例および言い換え後用例を解析することによって、解析済み入力文、解析済み言い換え前用例および解析済み言い換え後用例を作成する。類似用例選択部33は、解析済み入力文および解析済み言い換え前用例の類似度を算出する。類似用例選択部33は、算出された類似度に基づいて、解析済み言い換え前用例および解析済み言い換え後用例を解析済み類似用例ペアとして選択する。差分抽出部34は、解析済み類似用例ペアとして選択された解析済み言い換え前用例および解析済み言い換え後用例の差分を抽出する。言い換え生成部35は、解析済み入力文に、差分抽出部34によって抽出された差分を適用することによって、入力文が言い換えられた言い換え文を生成する。出力部36は、入力文の言い換え文を出力する。 (もっと読む)


【課題】文に含まれる括弧表現について構文解析時に文から分離すべきか否かを実例に即して分類する。
【解決手段】言語解析装置10は、文情報を格納した文書群格納部12から括弧表現が含まれる文情報を取得し、予め定められた規則に従って、上記取得した文情報に含まれる括弧表現を当該文情報から分離する第1の類型と分離しない第2の類型に仮分類し、当該括弧表現の仮分類結果に基づいて、括弧表現を第1の類型と第2の類型とに分類する規則を学習する機械学習部20により学習された規則に基づいて、所与の文に含まれる括弧表現を第1の類型又は第2の類型に分類する。 (もっと読む)


【課題】話し言葉のテキストにおいて先行詞候補の先行詞らしさを高精度に求めることができる省略解析装置を提供する。
【解決手段】入力されたテキスト10から述語を抽出する述語抽出部20と、前記抽出された述語の主語となる談話要素の候補を先行詞候補として述語周辺のテキストから抽出する先行詞候補抽出部30と、前記抽出された各先行詞候補のそれぞれに対し、語用論的な素性を含む素性値を付与する素性値付与部40と、前記付与された素性値から各先行詞候補の先行詞らしさを計算し、もっとも先行詞らしいと判断された候補を出力する省略要素推定部50とを備えた。 (もっと読む)


【課題】利用者からの検索要求文に基づいて適切な検索結果を得ることを可能とする。
【解決手段】入力処理部31は、検索要求文を入力する。構文解析部32は、検索要求文の構文解析結果を検索要求文解析結果格納部22に格納する。一次検索部33は、検索要求文に含まれる自立語を含む検索対象文を検索する。部分検索要求生成部34は、言い換えパタン格納部24を参照して検索要求文の部分検索要求文を生成する。言い換え検索部35は、言い換えパタン格納部24を参照して検索された検索対象文の言い換え文を生成する。言い換え検索部35は、部分検索要求文および検索対象文の言い換え文が類似するかを判定する。検索結果決定部36は、部分検索要求文および検索対象文の言い換え文が類似すると判定された場合、一次検索部33によって検索された検索対象文を検索要求文に対する検索結果として決定する。 (もっと読む)


【課題】高い信頼性で未知文字列から単語を特定する技術を提供する。
【解決手段】形態素解析用辞書を具備する形態素解析装置1は、文章に係る文章データを含む学習データを用いて、文章から1以上の文字から構成される文字列を抽出し、文章内において文字列の前後に出現する1以上の文字から構成される文字列の分布を集計した文字集計データを生成する文字列集計部110と、文字列集計部110によって生成された文字列集計データに基づいて、未知の文字列である未知文字列を2以上の単語に分割する際の境界を推定するとともに、境界にて未知文字列を分割した各単語を抽出する単語境界推定部20と、単語境界推定部20によって抽出された各単語の品詞を推定し、品詞属性を有する品詞付単語を生成する品詞推定部20と、品詞推定部20によって生成された品詞付単語を形態素解析用辞書に登録する辞書登録部30とを備える (もっと読む)


【課題】連接コストのばらつきを言語知識により平準化することができる装置、方法、およびプログラムを提供すること。
【解決手段】最小コスト法で用いる形態素解析辞書において、単語間の連接コストの統計的ばらつきを調整する辞書調整サーバ10は、所定のコーパスに基づいて、単語間の連接コストと、各単語が属する所定の品詞の組合せである品詞対の連接コストとを算出するコスト算出部11と、品詞対の連接コストが同等であるべき品詞対の組合せを指定する入力を受け付ける接続グループ受付部12と、指定された組合せに含まれる品詞対の連接コストを互いに近付けるように、単語間の連接コストを調整するコスト調整部13と、を備える。 (もっと読む)


【課題】文章情報に含まれる未知語を既知語に置換する有用な語の組み合わせを判定する正解判定装置を提供する。
【解決手段】正解判定装置は、複数の語から構成される第1の文章情報と、第1の文章情報に含まれる複数の語のうちいずれかの語が他の語に置換された第2の文書情報とを複数の語に分割し、解析部が分割した語と、予め記憶されている既知語とを比較して、予め記憶されていれば既知語であると判定し、予め記憶されていなければ未知語であると判定し、判定結果に基づいて、第1の文章情報に基づく語が未知語であり、第1の文章情報に基づく語に対応する第2の文章情報に基づく語が既知語である語の組み合わせを検出する。 (もっと読む)


【課題】コーパスに含まれる節・句情報が付与されていない文例に精度良く節・句情報を付与する。
【解決手段】自然言語処理装置10は、文に付与された節・句情報を制約条件に用いて構文解析する第1構文解析部14と、文に付与された節・句情報を制約条件に用いずに構文解析する第2構文解析部16と、第1構文解析部14と第2構文解析部16による解析結果が異なる場合に、第1構文解析部14による解析結果を正例、第1構文解析部14による解析結果に含まれず第2構文解析部16による解析結果のみに含まれる構文解析結果を負例として機械学習する機械学習部20とを含み、第2構文解析部16により節・句情報が付与されていない文について構文解析をした結果、複数の構文解析結果が得られた場合に、機械学習部20により算出される各構文解析結果の生成確率に基づいて構文解析結果を選択し、選択された構文解析結果に基づいて、文に節・句情報を付与する。 (もっと読む)


【課題】予め各例文中の機能表現候補文字列に対して人手で入力したタグ情報や、予め動詞や慣用表現ごとに用意された辞書情報などを用いることなく、助詞型機能表現の候補文字列が、機能表現として用いられていないことを特定する情報処理装置を提供する。
【解決手段】予め定められた助詞型機能表現の候補文字列を含む解析対象文について、当該解析対象文を構成する文要素の係り受けに関する情報を取得し、当該取得される係り受け関係に関する情報を用いて、候補文字列が解析対象文において助詞型機能表現として用いられていないことを特定する情報処理装置である。 (もっと読む)


【課題】 分析対象の文から所望の記述内容を効果的に抽出できるようにする。
【解決手段】 所望する記述内容を抽出するための複数の間接表現語を間接表現展開辞書2から取得し、アンケート結果記憶部3に記憶されているアンケートの回答文を構成する語の係り関係を解析部4により解析した結果に基づいて、当該回答文を構成する語のうち前記取得した複数の間接表現語のいずれかに対して係り元の関係を有する語又は係り先の関係を有する語の一方又は両方を特定部5により特定し、当該特定した語を基準とした意味チャンク(或いはフレーズ)を出力部6により出力する。 (もっと読む)


【課題】格フレーム情報を取得したいドメインのコーパスが少量しか存在しなくても、その目的のドメインに適した格フレーム情報を取得可能とし、そのドメインに対する解析精度を向上させる。
【解決手段】目的のドメインの少量のコーパスと目的のドメインとは異なるドメインの大量のコーパスの係り受け情報を作成し、この複数のドメインのコーパスから取得した係り受け情報を使って補語をクラスタリングし、このクラスタリングした係り受け情報の目的ドメインの情報のみを使って格フレームの選択制約を作成し、この選択制約に基づいて解析する。 (もっと読む)


【課題】問合せ者からの回答に際し、オペレータが問合せ者に向かって話した言葉に誤った敬語表現があれば正しい敬語表現に修正して正しい敬語表現で回答できるようにする。
【解決手段】オペレータAが問合せ者Sに向かって話した言葉を入力部2に入力して文章化する。解析部3で文章における主語を特定し、敬語解析部7で主語に対する敬語表現の正誤を判定し、敬語表現に誤用があれば変換部10で正しい敬語表現に修正する。文章再構成部15では、変換部10で変換した敬語を含む日本語表現に対して二重敬語の有無や用語の正誤などを検証し、誤用があれば修正する。音声合成部20は修正文を音声データに変換し、出力部30から電話回線を介して問合せ者Sに音声で回答する。 (もっと読む)


【課題】文をその区切りによって分割して得られる文要素に対して構文解析を行う場合に、構文解析に失敗しにくい構文解析装置を提供する。
【解決手段】解析対象文を複数の文要素に分割し、分割された複数の文要素の少なくとも一つについて、標準文法規則に基づいて当該文要素に適合する修正文法規則を生成し、当該生成された修正文法規則を用いて文要素の構文解析を行う構文解析装置である。 (もっと読む)


【課題】質問者の発言を記録することなく、回答者の発言から質問内容を推定する。
【解決手段】特定の認識結果データブロックの識別子に対応して、表示データのブロック識別子を抽出する工程と、抽出された表示データのブロック識別子に対応する各説明文について文構成要素を抽出し、各説明文について、各組み合わせルールに従って、抽出された文構成要素を組み合わせて複数の仮想回答文を生成し、特定の認識結果データブロックの内容と複数の仮想回答文とを比較して、仮想回答文毎に一致度を算出する工程と、所定の条件を満たす一致度が算出された仮想回答文の基となる組み合わせルールに係る質問文類型を特定し、特定の認識結果データブロックの識別子に対応して格納する工程とを含む。 (もっと読む)


【課題】文章に含まれる未知語の意味情報を推定して文章解析をすること。
【解決手段】本発明に係る文章解析システムは、解析対象である文章の構文解析結果を利用して、前記文章に含まれる未知語の意味情報を、前記文章に含まれる既知語の意味情報に基づいて推定する。 (もっと読む)


【課題】従来、ブログ等の文章群の文脈を可視化できなかった。
【解決手段】一人以上の個人が入力した1以上の文章群を格納し得る文章群格納部と、前記文章群格納部に格納されている文章群に含まれる文から、動作や状態の主体である主体語または動作や状態の客体である客体語である対象物を取得する対象物取得部と、前記文章群格納部に格納されている文章群に含まれる文から、前記対象物に対応する用語であり、動作や状態を示す用語である動作状態を取得する動作状態取得部と、前記対象物と、当該対象物に対応する動作状態とを対応付けた図である対応図を出力する対応図出力部とを具備する情報出力装置により、ブログ等の文章群の文脈を可視化できる。 (もっと読む)


41 - 60 / 109