説明

Fターム[5B009MF03]の内容

文書処理装置 (8,318) | 登録/削除 (89) | 自動取り込み (19)

Fターム[5B009MF03]に分類される特許

1 - 19 / 19


【課題】用語辞書作成者の負荷を増大させることなく、用語辞書を作成すること。
【解決手段】文書に記載された文章中に含まれる用語の辞書を生成する用語辞書生成方法であって、文書に含まれるテキスト情報から名詞句を抽出するステップ502と、前記抽出した名詞句が、辞書データベースに格納済みか否かを判断するステップ504と、前記抽出した名詞句が前述辞書データベースに格納済みの名詞句の場合に、前記抽出した名詞句の出現頻度に1を加算するステップ506と、前記抽出した名詞句が前記辞書データベースに格納されていない未知の名詞句である場合に、前記未知の名詞句を抽出元の文書の属性情報とともに前記辞書データベースに格納するステップ505と、前記辞書データベースに格納済みの名詞句と関連する他文書の属性情報を前記辞書データベースに格納するステップ507と有する。 (もっと読む)


【課題】知識ベース構築のコストを軽減する。
【解決手段】入力されたドキュメント中から、ドキュメント構造データベース21に格納されているドキュメント構造にマッチするパターンを有する文章単位を抽出するとともに(文書単位抽出部11)、抽出された文章単位の特徴を抽出し(特徴抽出部12)、ドキュメントに類似した例文の知識情報を、検出された特徴を用いて知識情報データベース25から検索し(知識検索部13)、検索された知識情報に対する編集を受け付け、編集を受け付けた編集後の知識情報と編集前の知識情報の元となる文章単位とを関連付けて知識情報データベース25および知識ベース26を編集する(知識編集部14)。これにより、既存のドキュメント(例文)や知識情報から再利用できそうなパーツを自然文と連動してリストアップする知識ベース構築環境を提供し、知識ベース構築のコストを軽減することができる。 (もっと読む)


【課題】 法令又は例規について作成された条文の用字用語審査において、他の法令や例規を引用することによって生じる課題に対応することが可能な用字用語審査装置等を提供する。
【解決手段】 ユーザ端末からユーザが作成した例規の条文を受信すると、形態素解析辞書と対照させて、条文を形態素に分解した分ち書き文を作成する。分ち書き文を構成する各々の単語について、用字用語辞書と対照させて、誤り表記に該当するものについて警告メッセージを作成する。ここで、法令名や例規名を品詞分解可能な語であっても一の形態素として形態素解析辞書に登録することによって、これらがさらに形態素に分解され、その一部が誤り表記と判定されてしまうことを回避することを可能にする。形態素解析辞書に登録される法令名と例規名は、最新の情報が記憶された法令データベース等との差分が自動更新される。 (もっと読む)


【課題】使用者の意図する内容に近い変換候補を抽出することができる携帯電話機及び携帯電話機プログラムを提供する。
【解決手段】携帯電話機(10)は、文字又は記号を入力する入力手段(14)と、入力手段(14)で入力された入力内容を入力内容に基づいて、他の文字、記号又はそれらの組み合わせに変換する変換手段(16)と、外部から入力した文書を記憶する記憶手段(15)とを備え、変換手段(16)は、入力内容の変換候補を、記憶手段(15)に記憶された文書に基づいて変換する。 (もっと読む)


【課題】言語処理装置、言語処理方法、言語処理システムおよびプログラムを提供すること。
【解決手段】テキストデータと、前記テキストデータに含まれるいずれかの語句を示す語句項目または前記語句項目が記憶されている所在を示す所在情報の少なくともいずれかを含むメタデータと、さらにメタデータが所在情報を含む場合は所在情報で示される所在に存在する語句項目と、を通信網を介して取得する取得部218と、前記メタデータに基づいて取得された前記語句項目を含むデータベースを作成する作成部220と、前記作成部により作成された前記データベースを記憶する記憶部224と、前記テキストデータの一部または全体を前記データベースを用いて分割し、前記データベースに含まれる前記語句項目により示される特定の語句を得る分割部228とを備えることを特徴とする。 (もっと読む)


【課題】改良されたセルラー電話インタフェース装置を用いたセルラー電話加入者のための予測的キーボード入力の改良された方法。
【解決手段】本発明において、インタフェース装置は加入者の各キーストローク(502)を、可能性の高い入力であると知られているテキストエントリのデータベース辞書ツリーと比較する(508)。セルラー電話インタフェース装置は、データベースから最も可能性の高
い一致エントリがある場合はこれを選択し、このエントリを加入者に表示する(510)。加
入者は、セルラー電話インタフェース装置によって示唆されたエントリを選択する(514)
か、または文字入力を続ける(512)ことができる。 (もっと読む)


【課題】ユーザ関連データの扱い易さを向上させた言語入力システムを提供する。
【解決手段】言語入力システムは、個人的なContactsファイル130及び共有して使用するGALファイル182のキャッシュであるOABファイル131の各々に含まれるコンタクト情報から自動的に抽出した辞書データを使用する。これにより、言語入力システムは、入力された読みに対する所望の表記を辞書から取得でき、ユーザは所望の表記を得るために次善策を講じる必要に迫られることが無い。さらに、言語入力システムは、Contactsファイル130及びOABファイル131の各々に含まれるコンタクト情報から抽出したコメントデータを使用し入力された読みに対する複数の表記に添えてコメントを表示する。これにより、言語入力システムを使用するユーザは、同音異義語があってもコメントを参考に入力された読みに対する所望の表記を辞書から効率良く取得出来る。 (もっと読む)


【課題】ユーザー辞書の登録内容の統計情報に基づいてユーザー辞書から重要語を抽出し、該重要語を基本辞書に登録することで、ユーザー辞書に登録された単語のなかで、信頼できるものだけを、他のユーザーも共有して利用することを可能にする。
【解決手段】ユーザー辞書登録部12に登録された、複数のユーザーの登録語彙情報を参照して、見出し語が同一の登録語彙情報が複数存在した場合に、該見出し語の登録語彙情報数、該見出し語の登録語彙情報であって対応する第2の言語表現も一致する登録語彙情報の数の少なくともいずれか一方に基づいて基本辞書14に追加する見出し語を抽出する重要語抽出部16と、前記抽出された見出し語の基本語彙情報を基本辞書14に登録する基本辞書更新部15とを備える。 (もっと読む)


【課題】画面に表示されている文字の入力が容易にできるようにする。
【解決手段】現在表示画面に表示されている内容としての文字列を形態素解析し、自動的に予測変換辞書に登録する(F104)。これにより、そのページを閲覧している際のページ内の文字を検索エンジンへ検索語として指定する場合など、ページ内に存在する何らかの文字の入力の際に、予測変換辞書を用いた入力方式を活用できるようにする。表示内容が変化したら、予測変換辞書の登録を再実行することで、常に表示されている文字が予測入力候補となるようにする。 (もっと読む)


【課題】ユーザが入力する文字列を、少ない操作回数で入力することができる文字列入力装置、テレビジョン受像機及び文字列入力プログラムを提供する。
【解決手段】放送もしくはネットワークからコンテンツを取得するコンテンツ取得手段と、コンテンツに含まれる文字列を抽出する文字情報抽出手段と、文字情報抽出手段が抽出した文字列を記憶する辞書記憶手段と、辞書記憶手段に記憶されている文字列の全部又は一部を候補文字列として表示する候補表示手段と、候補表示手段が表示した候補文字列のいずれかを入力確定文字列として決定する文字列決定手段とを有する。 (もっと読む)


【課題】辞書データを共有すべき相手を個々のユーザの単位で適切に選択することで、共有すべき辞書データが適切に抽出できる自然言語処理システム等を提供すること
【解決手段】自然言語処理システム1では、類似度計算手段21が第1のユーザ辞書と第2のユーザ辞書の間の類似度を計算する。登録候補抽出手段22は、類似度が予め定められた閾値以上である場合に第1のユーザ辞書に含まれかつ第2のユーザ辞書に含まれない辞書データを第2の辞書に対する登録候補として抽出する。ユーザ辞書登録手段23は、登録候補に含まれる辞書データを第2のユーザ辞書に登録する。 (もっと読む)


【課題】仮名漢字変換機能により変換されるような語句であっても、一度使用した語句は、使用者が登録作業を行なわなくても、予測候補として優先順位が高くできるようにする。
【解決手段】入力文字情報に対して使用者により選択可能な出力候補として、予測候補と共に、仮名漢字変換アプリケーションにより変換された変換候補を使用者に提示するようにする。使用者により出力候補の中から仮名漢字変換アプリケーションにより変換された仮名漢字変換候補が選択されたときに、当該仮名漢字変換候補の文字列を、入力文字情報についての予測候補として、予測候補検索用辞書に登録する。 (もっと読む)


【課題】
辞書に追加すべきデータのみを送信することで、電子機器、サーバ及び通信路の負荷の増加を低く抑えて辞書を更新することができる。
【解決手段】
ステップS110では、電子機器3が、更新タイミングになったかを判断し、更新タイミングになっていれば、ステップS120に進み、電子機器3が製品情報をサーバ1に対して送信し、サーバ1は受信した製品情報に対応する更新情報を電子機器3に対して送信する。ステップS130では、電子機器3が受信した更新情報に基づいて、辞書の更新を行うか否かを判断し、更新する場合はステップS140に進み、サーバ1から電子機器3に追加辞書のダウンロードが行われる。 (もっと読む)


【課題】 単語辞書データ供給サービスによらず、一般データから新しい未登録単語を抽出して登録し、文字入力を容易にすることができる単語登録装置を提供する。
【解決手段】 単語抽出手段22は、番組表記録部13に記録された電子番組表を構成するそれぞれの単語が、辞書部14(内蔵辞書15、あるいはユーザー辞書16)にすでに登録されているか否かを、辞書制御手段21を通じて照合し判断する。単語が未だ登録されていないと判断された場合は、一時記録手段23に一時的に登録する。読み解析手段24は、一時記録手段23に記録された単語と、辞書制御手段21を通じて内蔵辞書15及びユーザー辞書16を改めて照合し、単語の読み方を解析する。辞書制御手段21は、記録すべき単語、その読み方、登録日時及び電子番組表への掲載回数1をユーザー辞書19に記録する。 (もっと読む)


【課題】 テレビジョン放送を視聴しながら携帯メールを作成する際に、テレビジョン放送の内容に対応する変換候補を優先的に表示することで、文字入力操作の容易化を図る。
【解決手段】 テレビジョン放送の視聴中に文字入力が指定された場合、制御部17は、現在、視聴しているテレビジョン放送の電子番組表を解析し、または、該テレビジョン放送に多重化されている文字情報を解析し、或いは該テレビジョン放送の音声を解析することで、該テレビジョン放送の放送内容を示すキーワードを抽出する。そして、ユーザに入力された文字に対応する変換候補のうち、上記キーワードに対応する変換候補を予測変換辞書メモリ16から読み出して優先的に表示する。テレビジョン放送の内容に対応する変換候補を優先的に表示することで、現在、ユーザにより選択される可能性の高い変換候補を表示することができ、ユーザの文字入力操作を容易化することができる。 (もっと読む)


【課題】携帯端末において用いられる辞書を最適化すること。
【解決手段】携帯端末の辞書最適化システムは、複数の検索情報のそれぞれに関連する複数の用語群30を示すデータベース16と、そのデータベース16にアクセス可能な用語サーバ14と、その用語サーバ14と通信可能な携帯端末10とを備える。携帯端末10は、ユーザによる文章作成時に、携帯端末10で得られる携帯端末内情報群11を取得し、その携帯端末情報群11を用語サーバ14に送信する。用語サーバ14は、上記データベース16を参照し、携帯端末内情報群11に含まれる情報を検索情報として用いることによって、複数の用語群30から携帯端末内情報群11に関連する第1用語群15を抽出し、その第1用語群15を携帯端末10に通知する。携帯端末10は、第1用語群15で携帯端末10が有する辞書を更新する。 (もっと読む)


【課題】 本発明は、辞書学習方法、品詞情報と品詞バイグラムが追加された辞書を使用するユーザ端末装置の入力方法を提供する。
【解決手段】 本発明の辞書学習方法は、タグ無しのコーパスから用語集および統計的言語モデルを学習するステップ、用語集、統計的言語モードおよび補助的な単語符号化情報を小型サイズの辞書に統合するステップを有する。ユーザ端末装置によって、文レベル予測および単語レベル予測が得られ、辞書インデックスのパトリシア・ツリー・インデックスによって検索される辞書を使用することで入力が高速化される。 (もっと読む)


【課題】複数の利用者が端末装置から共有の専門用語辞書を利用する場合に正しい読み方を検索し易く、且つ、かな入力に対して表示装置上に所望の優先度で漢字変換表記を表示することが可能な共有型辞書システムを提供する。
【解決手段】基本辞書と学習型辞書を有する情報管理データベースと、利用者情報とを有するサーバに、複数の端末装置が接続されたネットワークを介して利用されるデータ共有型辞書システムにおいて、学習型辞書の用語をかな、漢字、個人利用者情報又は組織情報とを関連付けて各利用者が登録した用語を、サーバ側の学習型辞書に集約し、集約された辞書を各端末側の自己学習辞書に上書きや用語ごとに登録することによってネットワークを介して学習させて、利用者が常に最新の辞書を利用できると同時に、利用者情報に応じて使用可能な用語を制御でき、該辞書を各端末において日本語変換システムに適用できるシステムで構成される。 (もっと読む)


【課題】日本語、外国語のミックスした文章を効率良くかな入力して文書変換する。
【解決手段】ローマ字入力又はかな文字入力が可能な入力手段と、この入力手段から入力されるかな文字列をかな文書変換辞書を介して文書文字列に変換するかな文書変換手段とを具えた文書処理装置において、前記かな文字列を逆ローマ字規則により英文字列に変換するかな英字変換手段を設け、前記かな文書変換辞書の単語変換候補に、前記逆ローマ字規則により生成した英文字列を追加して提示/選択できるようにすることによって上記目的は達成される。 (もっと読む)


1 - 19 / 19