機械翻訳 | 処理対象要素

Fターム［5B091AB06］の内容

機械翻訳 (6,566) | 処理対象要素 (373) | 固有名詞 (79)

Fターム［5B091AB06］に分類される特許

1 - 20 / 79

ＣＪＫ名前検出

【課題】中国、日本、および韓国の言語のための名前を検出する。
【解決手段】名前検出に関する実施例が提供される。方法は、姓のコレクションと、n-グラムのコレクションを含む注釈付コーパスとを使用することで、未加工名前検出モデルを生成するステップを含み、各n-グラムは、前記注釈付コーパスにおいて名前として出現することの対応する確率を有する。方法は、前記未加工名前検出モデルを準構造化データのコレクションに適用して、注釈付準構造化データを形成するステップと、前記未加工名前検出モデルを大規模な注釈のないコーパスに適用して、名前を特定する前記大規模な注釈のないコーパスのn-グラムと、名前を特定しないn-グラムとを特定する大規模な注釈付コーパスデータを形成するステップとを含み、前記注釈付準構造化データは、名前を特定するn-グラムと名前を特定しないn-グラムとを特定する。方法は、名前検出モデルを生成するステップを含む。（もっと読む）

グーグル・インコーポレーテッド (191)

辞書管理装置、辞書管理方法、辞書管理プログラム

【課題】オンライン辞書について辞書管理の負担を軽減させた高品質な類似検索機能を提供する。
【解決手段】類似検索部３は、辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する。主要部特定部４は、類似検索手段で特定された類似表記と入力表記との共通部分を特定し、特定された共通部分が主要部辞書に存在すれば、該共通部分を主要部候補と判定する。この主要部候補を類似表記から除外した付加部候補が付加部辞書に存在するか否かを判定し、判定結果に応じて主要部候補を主要部と確定する。距離算出部５は、確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する。更新確認部６は、算出された編集距離順に類似表記・主要部・付加部を辞書管理者に提示する。（もっと読む）

日本電信電話株式会社 (13,992)

音声合成装置、音声合成プログラムおよび音声合成方法

【課題】テキストの読み上げ精度を向上させ、聞き手が判りやすい自然な読み上げ音声を生成することのできる音声合成装置を提供する。
【解決手段】音声合成装置１は、任意の対象についての情報を示す第１のテキストを形態素解析して第１の解析結果を出力する第１解析部５と、前記第１のテキストが示す情報と同一の対象について表現が異なる情報を示す第２のテキストを形態素解析し、前記第１の解析結果を参照して第２の解析結果を出力する第２解析部６と、前記第２の解析結果に基づいて、前記第２のテキストに関する合成音声を生成するための表音文字列を生成する表音文字列生成部８とを備える。（もっと読む）

富士通株式会社 (25,993)

略称検索装置，方法およびプログラム，ならびに略称検索機能を備えるデータパース装置

【課題】固有の名称が含まれる文字列から，辞書に未登録の略称を検索できるようにする。
【解決手段】データパース装置１は，検索対象を入力するデータ入力部１３と，辞書記憶部１１の辞書をもとに検索対象から法人名称を検索する辞書引き部１４と，検索対象に辞書に登録されていない文字列がある場合に，略称を検索する略称検索部１５を備える。略称検索部１５は，辞書の登録語と部分的に一致する登録語を検索し，検索した登録語から，部分一致する範囲が長く一致の割合が高いものを特定し，特定した登録語と一致する範囲を略称とし，特定した登録語をその正式名称とする。（もっと読む）

富士通株式会社 (25,993)

ＦＡＱ候補抽出システムおよびＦＡＱ候補抽出プログラム

【課題】談話データの特性に強く、文章構造の枠組みを規定せずに談話セマンティックに基づいて談話データからＦＡＱの候補となる質問文を抽出するＦＡＱ候補抽出システムを提供する。
【解決手段】談話データ１０１および談話セマンティクス２００を入力とし、談話データ１０１からＦＡＱ候補となる質問文を抽出して出力するＦＡＱ候補抽出システム１であって、談話セマンティクス２００は各ステートメントのフロー情報２１を含み、談話データ１０１から、顧客によって発話され、質問文もしくは要求文であることを示すフローが設定された質問・要求ステートメントを抽出する質問抽出部６０と、質問・要求ステートメントから指定されたキーワードを含むものを抽出する候補抽出部８０と、質問・要求ステートメントについてクラスタリングし、各クラスタの代表となる質問・要求ステートメントをＦＡＱ候補３００として出力するクラスタリング部９０とを有する。（もっと読む）

株式会社野村総合研究所 (1,067)

関係情報抽出装置、その方法及びプログラム

【課題】複数の固有表現間の関係情報を高精度で抽出可能な装置、方法及びプログラムを提供する。
【解決手段】入力された複数の固有表現に関係する情報を抽出する装置であって、前記各固有表現を含むテキストが入力されると、入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部１０と、解析処理部による解析結果を取得すると、入力テキストに含まれる少なくとも一つの自立語を関係情報候補として抽出するとともに、該各固有表現の関係情報として過去に用いられた過去関係情報が該関係情報候補に経時変化したと推定される度合を表す変化情報を、抽出された関係情報候補毎に取得し、解析結果及び変化情報に基づいて関係情報候補から関係情報を抽出する関係情報抽出処理部２０とを備えた。（もっと読む）

日本電信電話株式会社 (13,992)

関係情報抽出装置、その方法及びプログラム

【課題】あらゆるテキストにおいて、複数の固有表現間の関係情報を抽出可能な装置、その方法及びプログラムを提供する。
【解決手段】入力された複数の固有表現の関係情報を抽出する装置であって、各固有表現を含むテキストが入力されると、入力テキストを形態素解析するとともに入力テキストを構成する文節の係り受けを解析する解析処理部１０と、入力テキストを構成する複数の文のうち各固有表現を含む文とは異なる他の文から自立語を含む文節を関係情報候補として抽出した後に、各固有表現及び関係情報候補の全てが抽出されるまで入力テキストの文頭から順に抽出された名詞文節を、該名詞文節に伴う助詞に対応付けられた記憶領域に記憶させ、各固有表現及び関係情報候補の全てが抽出されると記憶領域における名詞文節の格納状態を表す格納情報を取得して、解析結果及び格納情報に基づいて関係情報を抽出する関係情報抽出処理部２０とを備えた。（もっと読む）

日本電信電話株式会社 (13,992)

固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム

【課題】固有表現を正しくかつ詳細に分類することを可能とする固有表現抽出装置、固有表現抽出方法、固有表現抽出プログラムを提供する。
【解決手段】テキストを入力とし、形態素と係り受け解析結果と固有表現を出力するテキスト解析部１１００と、形態素と固有表現を入力とし、トピックを抽出するトピック抽出部１２１０と、係り受け解析結果を入力とし、文構造を出力する文構造抽出部１２２０と、固有表現クラスを判定して出力するクラス判定部１２３０と、シソーラス１２４０と、文字列−固有表現クラス対データベース１２５０と、トピックと文構造と固有表現クラスを入力とし、ラベルスコアを出力とするラベルスコア計算部１３００と、ラベルごとのラベルスコア計算に用いられるラベル判定モデル１３１０と、ラベルスコア最大値からラベルを判定するラベル判定部１４００と、前記判定されたラベルと固有表現の組を出力する出力部１５００とを備える。（もっと読む）

日本電信電話株式会社 (13,992)

スパムブログ判定装置及び方法

【課題】管理者による作業を容易にしてスパムブログを判定するスパムブログ判定装置及び方法を提供する。
【解決手段】スパムブログ判定装置１は、登録指定を受け付けた所定キーワードを所定キーワードＤＢ２１に記憶する所定キーワード記憶制御手段１２と、判定対象のブログ記事を受け付けたことに応じて、所定キーワードＤＢ２１に記憶した所定キーワードを素性として用いてブログ記事がスパムブログであるか否かを機械学習により判定する機械学習手段１４と、機械学習手段１４による判定対象のブログ記事のうち、所定キーワードＤＢ２１に記憶された所定キーワードを含むブログ記事と、スパムブログであるか否かの機械学習による判定結果とを対応付けて出力するスパム判定結果出力手段１５と、所定キーワードの削除指定を受け付けたことに応じて、所定キーワードＤＢ２１に記憶された所定キーワードを削除する調整戻し手段１７とを備える。（もっと読む）

ヤフー株式会社 (1,128)

情報処理装置、情報処理方法、およびプログラム

【課題】「近傍の単語は互いに関係がある」という仮定に基づきながらも、その仮定が成立していない可能性をも考慮した、文脈情報を利用した統計的自然言語処理を確立する。
【解決手段】ステップＳ１で、処理対象の文書が特徴量抽出部に入力され、ステップＳ２で、特徴量抽出部が、処理対象の文書に含まれる文脈情報毎に特徴量を抽出する。ステップＳ３で、特徴量解析部は、処理対象の文書の各文脈情報の特徴量に対応する潜在変数をギブスサンプリングにより推定する。ステップＳ４で、クラスタリング処理部は、各文脈の文脈トピック比を新たな特徴量ベクトルとみなし、この特徴量ベクトルに基づいて、文脈情報（の固有名詞ペア）のクラスタリングを行う。ステップＳ５で、基本情報生成部は、解析結果DBに保持されているクラスタリング結果に基づいて基本情報を生成する。本発明は、文書の統計的自然言語処理に適用することができる。（もっと読む）

ソニー株式会社 (34,172)

情報抽出システム及び情報抽出プログラム

【課題】構文解析技術を用いることなく、自然文から構造化された情報を抽出する技術の提供。
【解決手段】企業名、企業活動、活動対象物を示す具体的な表現文字列毎にその種類を示す抽象化文字列を登録した辞書記憶部26と、文を形態素単位に分解し、各形態素に対応の抽象化タグを関連付ける形態素解析処理部12と、企業活動の抽象化タグが付与された形態素を文の述語と認定すると共に、主語に付属する助詞毎及び目的語に付属する助詞毎に対応語の格納欄が設けられた格スロットに、文の述語単位で対応語を充填し、述語を関連付ける格スロット充填処理部20と、抽出すべき主語の抽象化タグ及び助詞を特定する条件と、抽出すべき述語の抽象化タグを特定する条件と、抽出すべき目的語の抽象化タグ及び助詞を特定する条件が規定された抽出フレーム定義を、対応語充填済みの格スロットに適用し、文の主語、述語、目的語に該当する情報要素を抽出する情報抽出処理部22を備えた情報抽出システム10。（もっと読む）

株式会社野村総合研究所 (1,067)

株価影響企業検知システム及びプログラム

【課題】株価に影響を与えるイベントの有無を自動的に検知すると共に、このイベントによって株価に影響を受ける具体的な企業名を提示可能な技術の実現。
【解決手段】イベント情報を格納するイベント情報記憶部38と、各企業の属性情報を登録しておくオントロジ記憶部42と、イベントの属性と当該イベントによって株価に影響を受ける企業の属性との組合せパターン毎に、株価に与える影響がプラスかマイナスかを定義した推論ルールを格納する推論ルール記憶部40と、各イベント情報に対して推論ルールを適用し、当該イベントによって株価に影響が及ぶ企業の属性を特定すると共に、オントロジ記憶部42を参照して当該属性を備えた企業を株価影響企業として抽出し、株価影響企業のリストを生成してWebサーバ44に出力する株価影響企業抽出部26を備えた株価影響企業検知システム10。（もっと読む）

株式会社野村総合研究所 (1,067)

ＦＡＱ候補抽出システムおよびＦＡＱ候補抽出プログラム

【課題】話し言葉やノイズといった談話データの特性に強く、談話の文章構造の枠組みを規定せずに、談話データの構造を解析した結果からＱ＆Ａ対を抽出するＦＡＱ候補抽出システムを提供する。
【解決手段】談話データ１０１および談話セマンティクス２００を入力とし、談話データ１０１からＦＡＱ候補３００となる質問−回答対を抽出して出力するＦＡＱ候補抽出システム１であって、談話セマンティクス２００は各ステートメントのフロー情報２１を含み、質問文であることを示すフローが設定された第１のステートメントを同定し、さらに第１のステートメントの後に最初に現れ、かつ話者が異なり、談話に固有の事項について具体的な内容を述べているものであることを示すフローが設定された第２のステートメントを同定し、第１のステートメントと第２のステートメントとを質問−回答対として抽出するＱ＆Ａ対抽出部６０を有する。（もっと読む）

株式会社野村総合研究所 (1,067)

談話要約生成システムおよび談話要約生成プログラム

【課題】話し言葉やノイズといった談話データの特性に強く、談話データの構造を解析した結果から、所望の項目や内容が含まれる形で要約を生成する談話要約生成システムを提供する。
【解決手段】談話データ１０１および談話構造の解析結果である談話セマンティクス２００を入力とし、談話についての要約を生成して出力する談話要約生成システム１であって、要約の項目および記載内容を規定し、記載内容の一部または全部をプレースホルダとして指定した要約テンプレートと、プレースホルダを置換する内容を、談話セマンティクス２００に基づいて特定するためのルールを指定したマッピングルール７２と、要約テンプレート７４の各プレースホルダに対して、マッピングルールの指定内容に従って、談話データ１０１における対応する内容の文字列を取得して、プレースホルダを取得した文字列によって置換して要約３００を生成する談話要約部７０とを有する。（もっと読む）

株式会社野村総合研究所 (1,067)

用語間の対応関係抽出システム及び対応関係抽出プログラム

【課題】テキストデータに基づいて各企業の商品名を抽出し、対応する製品分類に自動的に関連付ける技術を提供する。
【解決手段】一般名称としての製品分類を複数格納した製品分類辞書16と、入力されたテキスト文を形態素単位に分解すると共に、製品分類辞書16を参照し、各形態素の中で製品分類に該当するものに対して対応のタグを付する形態素解析処理部12と、タグを含む文字列パターンと、この文字列パターン中からタグを付された製品分類に属する具体的商品名として抽出すべき文字列の位置とを規定する抽出ルールを、複数格納しておく抽出ルール記憶部18と、テキスト文の中の抽出ルールにマッチする文字列パターン中の所定の位置に存する文字列をタグが付された製品分類に属する商品名として抽出し、この製品分類と商品名との組合せを関係情報記憶部20に格納する関係情報抽出部14とを備えた用語間の対応関係抽出システム10。（もっと読む）

株式会社野村総合研究所 (1,067)

姓名による属性解析方法、プログラム及びシステム

【課題】会員情報として登録された名義データに基づいて、会員情報としては登録されていない当該会員の属性の判別を行う。
【解決手段】入力された名義データにつき、（１）予め記録されている苗字辞書との前方一致検索、（２）予め記録されている名前辞書との後方一致検索、及び（３）予め定義された特徴情報の該当判別を順次行う。（１）（２）において一致が存在すれば対象と判定して処理を終了する。（１）（２）に該当しなかった場合（３）の判別を行い、その結果に応じて対象／対象外を判定する。（もっと読む）

株式会社ミクシィ (13)

自然言語処理装置及びプログラム

【課題】固有名詞の換喩表現の抽出精度の向上を図ること。
【解決手段】自然言語処理装置は、所与の固有名詞又は所与の固有名詞と同格の語、を主語とし、且つ、動詞リストに記憶される、固有名詞の換喩表現である語を目的語とする文に用いられ得る動詞を含む文を検索する文検索部２０と、文検索部２０により検索された文に含まれる、動詞リストの動詞の目的語を取得する目的語取得部２２と、目的語取得部２２により取得された目的語を上記所与の固有名詞の換喩表現として辞書に登録する登録部２４と、を含む。（もっと読む）

富士ゼロックス株式会社 (21,908)

抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム

【課題】指定された位置に対応する情報と同等の概念を有する情報を効率よく抽出可能な抽出規則を作成できる抽出規則作成システムを提供する。
【解決手段】組合せ位置情報作成手段８１は、タグ付きテキストと、文字列またはタグの位置を示す３個以上の位置情報と、キー情報とをもとに組合せ位置情報を作成する。単語タグ文字列作成手段８２は、その組合せ位置情報に含まれる位置情報が示す位置の単語またはタグを組み合わせた単語タグ文字列をその組合せ位置情報ごとに作成する。単語タグ文字列選択手段８３は、評価値を算出して単語タグ文字列を選択する。付属文字列抽出手段８４は、タグ付きテキストを文節ごとに分割した単語のうち、位置情報が示す位置の文字列を含む文節分割単語を抽出し、その文節分割単語から、位置情報が示す位置に含まれない付属文字列を抽出する。抽出規則作成手段８５は、単語タグ文字列と付属文字列とをもとに抽出規則を作成する。（もっと読む）

日本電気株式会社 (19,353)

抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム

【課題】ユーザが欲する情報を抽出するための規則を効率よく作成する抽出規則作成システムを提供する。
【解決手段】抽出規則作成手段８２は、タグ付きテキスト及びそのタグ付きテキスト中の文字列の位置を示す情報である文字列位置情報が与えられたときに、その文字列位置情報が示す位置に対応する単語又はタグと、その単語又はタグの前後の単語又はタグとを組み合わせて、タグ付きテキストから情報を抽出するための規則である抽出規則を作成する。適合文位置情報抽出手段８３は、タグ付きテキスト記憶手段８１に記憶されたタグ付きテキストごとに、抽出規則に適合する単語又はタグを含む適合文の位置を示す情報である適合文位置情報を抽出する。評価値算出手段８４は、１つのタグ付きテキスト内に現れる適合文がより少ないほど評価値を高く算出し、より多くのタグ付きテキスト内に適合文が現れるほど評価値を高く算出する。（もっと読む）

日本電気株式会社 (19,353)

語句抽出ルール生成装置、語句抽出システム、語句抽出ルール生成方法、及びプログラム

【課題】学習データが意味的に類似するクラスを含む場合、及びそうでないクラスを含む場合のいずれであっても、語句のクラスを正しく分類可能な抽出ルールを学習し得る、語句抽出ルール生成装置、語句抽出ルール生成方法、及びプログラムを提供する。
【解決手段】語句抽出ルール生成装置２は、特徴量とクラス情報とを含む学習データから、特定のクラスの語句を抽出するための語句抽出ルールを生成する装置である。語句抽出ルール生成装置２は、特徴量の種類と、特徴量の種類別に付与されている特徴量の重みとによって予め設定された各クラスの定義を用いて、学習データの特徴空間を変換する特徴空間変換部２０と、特徴空間変換部２０によって特徴空間が変換された学習データから語句抽出ルールを学習する、抽出ルール学習部２１とを備えている。（もっと読む）

日本電気株式会社 (19,353)

1 - 20 / 79

[ Back to top ]

Fターム［5B091AB06］の内容

Fターム［5B091AB06］に分類される特許

ＣＪＫ名前検出

辞書管理装置、辞書管理方法、辞書管理プログラム

音声合成装置、音声合成プログラムおよび音声合成方法

略称検索装置，方法およびプログラム，ならびに略称検索機能を備えるデータパース装置

ＦＡＱ候補抽出システムおよびＦＡＱ候補抽出プログラム

関係情報抽出装置、その方法及びプログラム

関係情報抽出装置、その方法及びプログラム

固有表現抽出装置、文字列−固有表現クラス対データベース作成装置、固有表現抽出方法、文字列−固有表現クラス対データベース作成方法、プログラム

スパムブログ判定装置及び方法

情報処理装置、情報処理方法、およびプログラム

情報抽出システム及び情報抽出プログラム

株価影響企業検知システム及びプログラム

ＦＡＱ候補抽出システムおよびＦＡＱ候補抽出プログラム

談話要約生成システムおよび談話要約生成プログラム

用語間の対応関係抽出システム及び対応関係抽出プログラム

姓名による属性解析方法、プログラム及びシステム

自然言語処理装置及びプログラム

抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム

抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム

語句抽出ルール生成装置、語句抽出システム、語句抽出ルール生成方法、及びプログラム

メニュー

スポンサーリンク

Fターム［5B091AB06］の内容

Fターム［5B091AB06］に分類される特許

メニュー

スポンサー リンク

スポンサーリンク