説明

Fターム[5B075NK32]の内容

検索装置 (67,127) | 検索キー情報 (8,147) | 検索キー情報の自動抽出 (2,419) | 自然言語解析による検索キーの抽出 (1,229)

Fターム[5B075NK32]の下位に属するFターム

Fターム[5B075NK32]に分類される特許

201 - 220 / 794


【課題】膨大な量の学習コーパスを必要とすることなく、精度の高い単語出現確率を算出する。
【解決手段】直接出現確率算出部15Bにより、語義別見出語と語義文の組み合わせごとに、当該語義文内に当該語義別見出語が出現する直接出現確率14Cを算出し、間接共起確率算出部15Cにより、任意の語義別見出語が複数の語義文においてそれぞれ異なる語義別見出語と共起するという連接共起関係を経ることにより、任意の2つの語義別見出語が1つ以上の語義別見出語を介して間接的に共起する間接共起確率14Dを語義別見出語対ごとに算出し、単語出現確率算出部15Dにより、間接共起確率14Dから生成した間接共起確率行列Cと、直接出現確率14Cから生成した直接出現確率行列Aとの行列積CAを算出し、当該行列積CAの各行列要素を単語出現確率14Eとして出力する。 (もっと読む)


【課題】人手によるトレーニングデータを用いることなく、電子文書の内容を表現するキーワードを適切に抽出する。
【解決手段】キーワード抽出装置1のキーワードリスト生成手段5は、検索エンジン2のクエリログ3を解析して一定の条件を満たすクエリをキーワードとして抽出し、該キーワードのリストを生成する。用例収集手段7は、前記検索エンジン2から前記リスト中のキーワードの検索結果を取得し、該検索結果のタイトルおよび概要文においてキーワードが用いられる用例を収集する。モデル生成手段8は、前記用例収集手段7で収集された用例を基に前記キーワードを抽出するための抽出モデルを生成し、キーワード抽出モデルデータベース9に格納する。キーワード抽出手段10は、前記電子文書に前記抽出モデルを適用して、該文書からキーワードを抽出する。 (もっと読む)


【課題】災害のような緊急時あるいは緊急時を想定した訓練時に、防災のため実際にどういった行動をとればよいかを確認する。
【解決手段】この対応行動予測システムは、緊急時に通信ネットワークから受信された電文を自然言語解析して得られた文字列を形態素毎に区分する自然言語解析部と、区分された文字列の中から出現頻度の高いキーワードを抽出するキーワード抽出部と、キーワードをキーにして、典型的な連絡通報を区分した各フェーズ毎に連絡通報に期待される行動と連絡通報に含まれるキーワードとを対応して記憶したデータベースを参照し、連絡通報のフェーズを特定し、特定したフェーズにおいて対応者がなすべき行動を出力する行動予測部とを備える。 (もっと読む)


【課題】印刷、複写、廃棄などのログをテキストで高精度に検索することができない。
【解決手段】印刷時、印刷データからテキストを抽出し、かつ印刷データに識別子を書き込んでおく。検索時、検索キーワードにヒットしたログと同一の識別子をもつ複写や廃棄のログも一緒に出力する。具体的には、検索条件に基づいて紙文書来歴DBが格納するログ情報を検索する紙文書ログ検索部と、検索したログ情報を出力する出力部と、検索条件、及び出力したログ情報から前記紙IDの選択を入力する入力部と、選択された紙IDを含むログ情報を紙文書来歴DBから検索する紙文書来歴検索部とを具備する。 (もっと読む)


【課題】検索キーワードに含まれないキーワードも利用して、短時間で回答文書を分類することができる回答文書分類装置を提供することを目的とする。
【解決手段】単語と品詞とが組み合わされ、所定の条件を示すパターンである条件パターンを蓄積し、入力テキスト集合に含まれている文が、上記蓄積されている条件パターンを含んでいれば、上記条件パターンの前方に配置されている単語の配列である条件キーワードを抽出し、上記条件パターンを含んでいなければ、主格になる文節に含まれている単語である主格キーワードを抽出し、条件キーワードおよび主格キーワードに含まれるキーワード毎に、着目しているキーワードが上記条件キーワードとして出現する出現回数と、上記主格キーワードとして出現する出現回数とを集計し、上記2つの出現回数が所定の条件を満たせば、上記着目しているキーワードが分類キーワードである。 (もっと読む)


【課題】文書を、あらかじめ定めたジャンル群の内の該当するジャンルに分類する文書分類を高速に行うことを可能とするベクトル間距離算出装置、ベクトル間距離算出方法、プログラム及び記録媒体を提供することを目的とする。
【解決手段】単語と該単語に対応するベクトルの組の集合を格納する単語ベクトルデータベースと、ジャンルと該ジャンルに対応するベクトルの組の集合を格納するジャンルベクトルデータベースと、任意の単語と任意のジャンルに対し、前記単語ベクトルデータベース中の該単語のベクトルと、前記ジャンルベクトルデータベース中の該ジャンルのベクトルとの距離を算出し、該単語、該ジャンル、該距離の組を単語・ジャンル間距離データベースに格納する単語・ジャンル間距離算出手段とを有する。 (もっと読む)


【課題】文の意味合いを重視した検索結果を用いて、分かりやすい表示を効率よく実現すること。
【解決手段】前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を得る検索処理部と、前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する通信部とを備える。 (もっと読む)


【課題】文の意味合いを重視した検索結果を用いて、分かりやすい表示を効率よく実現すること。
【解決手段】前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を得る検索処理部と、前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する通信部とを備える。 (もっと読む)


【課題】Web上で提供されているフィード内に記述されたコンテンツを判別すると共に、ユーザの嗜好に合ったコンテンツに関する情報を提供する。
【解決手段】ユーザのコンテンツに対するカテゴリ別評価値を記憶するユーザ情報記憶部102と、Webサーバ3から取得したフィードに基づくコンテンツの概要情報、コンテンツURL、及びコンテンツのカテゴリを記憶したコンテンツ情報記憶部107を有し、ユーザ端末2からの求めに応じ、ユーザによる評価値の高いカテゴリを特定し、コンテンツ一覧作成部109が、当該特定したカテゴリと関連付けられているコンテンツに関する情報を一覧としたコンテンツ一覧を作成する。コンテンツ一覧に基づき、ユーザ端末2からコンテンツの選択情報を受信すると、当該選択に係るコンテンツのコンテンツURLを返信する一方、評価値更新部112が、当該コンテンツのカテゴリに対するユーザの評価値を更新する。 (もっと読む)


【課題】番組等の音声認識結果と発話内容に関連する話題とを検索結果として表示することのできる音声情報抽出装置を提供する。
【解決手段】音声情報抽出装置は、映像および音声を取得する映像音声収録部と、音響モデルと言語モデルとを用いて前記音声の音声認識処理を行なう音声認識部と、取得した映像および音声に関連するテキストデータを外部から取得するテキストデータ取得部と、取得したテキストデータと音声認識処理の結果とを比較することにより話題を抽出する話題抽出部と、音声認識結果と話題とを統合してなる音声情報を音声情報記憶部に書き込む音声情報統合部と、音声認識結果に基づき検索用インデックスを作成する検索用インデックス作成部と、検索語による検索要求に基づき検索用インデックス音声情報を検索し、該当する映像および音声に関連する音声情報を読み出して提示する検索サーバ部を具備する。 (もっと読む)


【課題】重要文抽出と文短縮を組み合わせて、予め指定した要約率や制限文字数いっぱいまでの長さの、読み易く且つ分かり易い要約を作成すること。
【解決手段】文選択部4が、重要文テーブル2から入力文書中の未選択文のうちで最も重要順位が高い文を選択し、文短縮長決定部5が、制限長と、短縮文書テーブル3に格納されている入力文書中の文を短縮した短縮文からなる短縮文書の長さとから、前記選択された文に対する文短縮長を動的に決定し、文短縮部6が、当該文短縮長に従って前記選択された文を短縮し、短縮文格納部7が、短縮文を短縮文書テーブル3に格納するとともに入力文書の出現順序に基づいて短縮文書の並び替えを行い、出力部8が、短縮文書テーブル3中の短縮文書の長さが前記制限長に対して規定の割合に達するまで、前記文選択から短縮文格納までを繰り返し行わせ、その結果を入力文書の要約として出力する。 (もっと読む)


【課題】カテゴリレベルの嗜好とキーワードレベルの嗜好の両方を考慮したレコメンデーションを可能とする。
【解決手段】ユーザ特徴ベクトル計算部24は、ユーザが閲覧したコンテンツを示す履歴コンテンツに基づいてユーザ特徴ベクトルを計算する。そして、コンテンツカテゴリ評価値計算部26は、ユーザ特徴ベクトルと配信対象コンテンツの特徴ベクトルとの類似度を示す予測値Pを計算する。一方、固有名詞抽出部27は、履歴コンテンツから固有名詞の集合を抽出し、固有名詞評価値計算部27aは、抽出された固有名詞に基づいて生成された固有名詞型ユーザ特徴ベクトルと、配信対象コンテンツのコンテンツ特徴ベクトルとの類似度を計算する。そして、コンテンツ予測計算部27cは、予測値および類似度に基づいて更新予測値を計算し、計算された更新予測値に基づいて定められたコンテンツをレコメンド情報として生成して配信する。 (もっと読む)


【課題】ユーザの好みにより近いサーチ結果をもたらすために、サーチクエリーをより絞り込んで定義されたクエリーに改良する際にユーザへの支援を提供する。
【解決手段】受信クエリーは、該受信クエリーに対応するランク付けされた文書の初期グループを作成するように処理される。ランク付けされた文書の初期グループ内の文書の全部又は一部の各文書は、ランク付けされた候補用語のそれぞれのセットの各候補用語が文書内に組み込まれるように、ランク付けされた候補用語のそれぞれのセットに関連付けられる。ランク付けされた候補用語の各それぞれのセットは、受信クエリーの処理の前の時点で識別される。選択関数に従って、候補用語のそれぞれのセットの1つ又はそれ以上内の候補用語のサブセットが選択される。受信クエリーに応答して、ランク付けされた文書の初期グループと候補用語のサブセットとが提示される。 (もっと読む)


【課題】入力語を該当する所定のコードに従来よりも高い確率で変換し得るコード変換装置、コード変換方法、コード変換プログラム、コード変換支援装置、コード変換支援方法及びコード変換支援プログラムを提案する。
【解決手段】コード変換装置3では、入力装置2から取り込んだ診断書データにおいて仮に該当項目に入力傷病名として単に「骨折」とだけあっても、補助該当項目に入力部位名「大腿部」とあれば、コード化ルールテーブル50に基づいて、当該入力傷病名「骨折」が正式傷病名「大腿骨骨折」を意図していると推測し、当該正式傷病名「大腿骨骨折」のICD−10コード53に入力傷病名を変換でき、かくして入力傷病名を該当する所定のICD−10コード53に従来よりも高い確率で変換し得る。 (もっと読む)


【課題】検索の漏れをなくしつつ、適切な検索結果を与えることのできる検索技術を提供する。
【解決手段】検索に使用する索引を構築する際に、1つの文書を形態素解析とNグラム方式の2つの方式によってトークン分割し、複数のトークン分割結果より全トークンの境界を計算し、各トークンの出現位置情報と次に続くトークンの出現位置情報を計算し、索引付けを行う。次に、コンピュータ・システムは、元文書の復元およびヒット位置の強調表示のために、複数のトークン分割結果から算出した全トークン境界からなるトークン列を保管する。この時、各トークンの開始位置番号、終了位置番号と共に保管する。検索にあたっては、ユーザーが入力した検索語をそれぞれのトークン分割方法によって分割し、出来上がったトークン列をORで結合して検索を行う。これによってどちらかのトークン列が一致した場合には検索結果に含まれるため、検索漏れを防ぐことができる。 (もっと読む)


【課題】 従来の自動応答文生成は,インターネット上の掲示板やブログ,チャットなど,利用者がどのような事項に対する対話を行うか不明確であるとともに,対話が進むにつれ話題が変化することもしばしばあるため,あらかじめ応答文もしくは応答すべき事項の知識を準備することは不可能であり,しばしば,まったく整合性のない応答文が生成されるという問題が生じていた.
【解決手段】 人間が発信した言語情報からキーワードを抽出し,このキーワードに対してインターネットにおけるWeb上の情報を収集しキーワードを補完し,これらのキーワードに対して分野連想語辞書を照合することで,まず人間が発信した言語情報がどのような話題の言語情報であるかを確定する.その後,人間が発信した言語情報から抽出したキーワードおよびその分野情報と応答文の雛形となる文テンプレートから文生成を行うことで,不特定の話題であっても話題に対して適切な応答文を生成することを特徴とする. (もっと読む)


【課題】学習データ量が少量の場合にも高い精度で分類が可能であり、計算量が少なくて済む文書自動分類方法及び文書自動分類システムを提供する。
【解決手段】事前分布推定用の文書の集合の中でクラスxに分類されている文書の数、及び分類されている文書に含まれるキーワードkeyiの数を示す事前分布推定用頻度データが格納されている第1の記憶手段と、学習用の文書の集合の中でクラスxに分類されている文書の数、及び文書に含まれるキーワードkeyiの数を示す学習用頻度データが格納されている第2の記憶手段を備えたデータ処理システムが、新規文書を既存文書が分類されているクラスのいずれかに分類する文書自動分類方法であって、第1の記憶手段及び第2の記憶手段から、各クラスの事前分布推定用頻度データ及び学習用頻度データをそれぞれ読込むステップと、誤り率を最小にするベイズ基準のもとで分類クラスを決定するステップとを実行する。 (もっと読む)


【課題】契約書の作成段階において、経験や知識がない契約担当者でも容易に契約書の審査をすることができる文書審査支援装置、文書審査支援方法およびプログラムを提供する。
【解決手段】審査の対象である契約書の契約書データを記憶する契約書データ記憶部と、記憶された契約書データから予め定められた条項のデータを分割した契約書分割データを生成する契約書分割部と、審査対象の契約書の種別毎に予め定められた契約書の審査項目であって、契約書に対応して予め規定された審査項目データを取得する審査項目取得部と、審査項目取得部によって取得された審査項目データに基づいて、契約書分割部によって生成された契約書分割データから、審査項目に関連する関連条項を検索する審査項目対応条項検索部と、審査項目データと審査項目対応条項検索部によって検索された関連条項とを、契約書データに対応付けた審査データを生成する表示画面生成部と、を備える。 (もっと読む)


【課題】キーワードを二次元マップに可視化する際に、トピックが分散している場合であってもキーワード間の関連度を適切に表現することができるキーワード二次元可視化方法を提供する。
【解決手段】文書群130の各文書から特徴語を抽出し、重要度を示す重み付け値を算出して特徴語データとする第1ステップと、特徴語データをマージする第2ステップと、特徴語データが上位のものをキーワードとして抽出する第3ステップと、特徴語が出現する文書の数に基づいて特徴語をダミー語として選定する第4ステップと、各文書と各キーワードおよび各ダミー語とによって特徴語データをクロス集計する第5ステップと、クロス集計した結果に主成分分析を施して各キーワードの座標点を算出し、また、特徴語データの平均値から各キーワードの文字サイズを算出する第6ステップと、各キーワードを配置してキーワードマップ210を描画する第7ステップとを実行する。 (もっと読む)


【課題】テキストデータからなる記事に対して、ユーザ毎の嗜好に合致したタグ候補を精度良く選定して自動的に付与もしくは推奨することができるタグ付与方法およびタグ付与プログラムを提供する。
【解決手段】新着記事101から1つ以上の特徴語を抽出し、抽出した前記各特徴語に対して重要度を示す重み付け値を算出して新着記事101の特徴語データとする第1ステップと、タグ204毎に、各既存記事202から1つ以上の特徴語を抽出し、抽出した前記各特徴語に対して前記既存記事における前記重み付け値を算出し、その平均値を算出してタグ204毎の特徴語データとする第2ステップと、第1ステップで算出した新着記事101の特徴語データと、第2ステップで算出したタグ204毎の特徴語データとの類似度を算出する第3ステップと、前記類似度が上位の前記タグを新着記事101についてのタグ候補として選定する第4ステップとを実行する。 (もっと読む)


201 - 220 / 794