説明

Fターム[5B091CC01]の内容

機械翻訳 (6,566) | 辞書、知識ベース (865) | 辞書の種類 (414)

Fターム[5B091CC01]の下位に属するFターム

Fターム[5B091CC01]に分類される特許

1 - 20 / 125


【課題】複数種類の疾病名が混在する医用文書に対して同義語となるキーワードの組を正しく、かつ小さい処理負荷で抽出する同義語辞書作成装置を提供する。
【解決手段】読影レポートからキーワードを取得するキーワード取得部104と、取得したキーワードと共起する疾病名を取得する共起疾病名取得部105と、取得したキーワードから一組のキーワード対を選択するキーワード対選択部106と、(i)取得した疾病名の中から、キーワード対を構成する各キーワードと共起する疾病名を選択し、(ii)選択した疾病名からキーワード対を構成するキーワード間で共通する疾病名を抽出し、(iii)抽出した疾病名を含む読影レポートを、症例データベース101に記憶されている症例データの中から抽出する共通疾病名文書抽出部107と、抽出した読影レポートを用いて、キーワード対が同義語であるか否かを判定する同義語判定部108とを備える。 (もっと読む)


【課題】大規模な書き言葉コーパスを相槌を含む大規模なコーパスに変換すること。
【解決手段】コーパス変換装置100は、相槌を含む学習コーパス10の文を取得する学習コーパス取得部110と、コーパス取得部110で取得した文に基づいて、文長毎に、文中の各位置の相槌の出現確率を算出する出現位置確率算出部120と、算出した出現確率を文長および文中の位置に対応つけて記憶する出現位置確率記憶部130と、学習コーパス取得部110で取得した文に基づいて、相槌の種別毎に、文中の各位置の相槌の出現確率を算出する出現種別確率算出部140と、算出した出現確率を相槌の種別および文中の位置に対応つけて記憶する出現種別確率記憶部150と、出現位置確率記憶部130と出現種別確率記憶部150とに基づいて、大規模コーパス30の文に相槌を挿入し、相槌を含む大規模なコーパスを構築する変換手段と、を備える。 (もっと読む)


【課題】文例辞書への文例の登録を簡便化すること。
【解決手段】文例辞書生成プログラムは、複数のプログラムからアクセス可能なメモリ領域に記憶された第一の文字列を取得し、前記第一の文字列に含まれる空白及び/または制御コードを除去して第二の文字列を生成し、前記第二の文字列より文例を抽出し、前記文例を読みに対応付けて記憶部に記憶する処理をコンピュータに実行させる。 (もっと読む)


【課題】機械翻訳用の辞書への新語の登録において、簡易な処理で、世の中で広く用いられている訳語を登録する。
【解決手段】検索に用いられた検索キーワードについて、検索回数と検索キーワードの翻訳辞書8への登録の有無を検索履歴6として記録する検索履歴生成部5と、翻訳辞書8に登録されていない検索キーワードについて、翻訳辞書8に登録されている複数の単語に分解し、各々の単語に対して複数の訳語が登録されている場合には、それぞれの訳語を組み合わせて複数の訳語候補を作成し、各々の訳語候補について翻訳辞書8への登録の有無を確認し、登録されている場合には、検索回数が最も多いものを訳語に決定して翻訳辞書8に登録する翻訳辞書生成部7と、を備える。 (もっと読む)


【課題】表記が類似しない文字列同士の対応を反映させた読替え辞書を作成する。
【解決手段】読替え辞書作成支援装置10において,取得部11は,第1の文字列と第2の文字列とを取得する。解析部12は,形態素解析により,第1の文字列と第2の文字列とをそれぞれ単語に分解する。抽出部13は,第1の文字列に含まれる単語または複合語である文字列と,第2の文字列に含まれる単語または複合語である文字列との対応を抽出する。表示部14は,抽出した文字列の対応をディスプレイ18等の表示装置に表示する。受付部15は,ユーザによる表示装置に表示された文字列の対応からの読替え可能な文字列の対応の選択を受け付ける。登録部16は,読替え辞書記憶部100に記憶された読替え辞書に,選択された読替え可能な文字列の対応を登録する。 (もっと読む)


【課題】構文構造が異なった対訳文対から翻訳テンプレートを生成できるようにする。
【解決手段】取得手段1aは、第1の言語文と第2の言語文とを取得する。分割手段1bは、取得した第1および第2の言語文それぞれを、複数の形態素に分割する。カウント手段1cは、取得した第1および第2の言語文から分割された各形態素の出現頻度をカウントする。検出手段1eは、取得した第1の言語文から出現頻度が2以上の形態素を検出し、該検出された形態素の第2の言語における訳語であり、出現頻度が1の形態素を、取得した第2の言語文から検出する。生成手段1fは、取得した第1および第2の言語文それぞれから検出された形態素を変数に置き換える置換処理を行い、該置換処理後の第1および第2の言語文を含む翻訳テンプレートを生成する。 (もっと読む)


【課題】ベースとなる単語対応付けアルゴリズムに依存することなく、高精度かつ汎用性の高い単語対応付けを行う。
【解決手段】目的分野単語対応付け学習部12により、目的分野の対訳データを用いて目的モデルMinを学習し、一般分野単語対応付け学習部14により、一般分野の対訳データを用いて一般モデルMgenを学習する。目的分野対応付け確率推定部16により、目的モデルMinを用いて目的分野の対訳データを単語対応付けしたときの単語対応行列Ainに相当する確率Tij及びtijを推定し、一般分野対応付け確率推定部18により、一般モデルMgenを用いて同一の目的分野の対訳データを単語対応付けしたときの単語対応行列Agenに相当する確率Gij及びgijを推定する。単語対応行列生成部20により、確率Tij、tij、Gij及びgijを統合することにより、単語対応行列Aを生成する。 (もっと読む)


【課題】オンライン辞書について辞書管理の負担を軽減させた高品質な類似検索機能を提供する。
【解決手段】類似検索部3は、辞書管理者の入力表記に基づき全体辞書を検索し、入力表記に類似する表記を特定する。主要部特定部4は、類似検索手段で特定された類似表記と入力表記との共通部分を特定し、特定された共通部分が主要部辞書に存在すれば、該共通部分を主要部候補と判定する。この主要部候補を類似表記から除外した付加部候補が付加部辞書に存在するか否かを判定し、判定結果に応じて主要部候補を主要部と確定する。距離算出部5は、確定された各類似表記の主要部と入力表記の主要部との編集距離を算出する。更新確認部6は、算出された編集距離順に類似表記・主要部・付加部を辞書管理者に提示する。 (もっと読む)


【課題】データベースの最適化に係る作業を効率化し、ユーザの負担を軽減することを課題とする。
【解決手段】文書データを解析するための解析キーを含む解析用データが蓄積されるデータベースに接続される情報処理装置に、データベースから、解析キーの構成を把握するための基準となる1または複数の解析キーを、単位解析キーとして抽出する単位解析キー抽出部25と、単位解析キーを用いて、データベースに含まれる解析キーの構成を把握する構成把握部26と、構成把握部26によって把握された構成に従って、単位解析キーに関連づけられた情報を用いて、データベースに含まれる解析キーに関連づけられる情報を更新するデータベース更新部29と、を備えた。 (もっと読む)


【課題】ユーザがデータベースの構造を意識することなくデータベースの更新を行うことを可能とし、ユーザの負担を軽減することを課題とする。
【解決手段】文書データを解析するための解析キーを含む解析用データが蓄積されるデータベースに接続される情報処理装置に、データベースの更新に用いられる解析キーである更新用解析キーを取得する更新用解析キー取得部21と、解析用データに含まれる情報と、更新用解析キーに関連付けられた情報との適合程度を判定する適合程度判定部23と、適合程度判定部23による判定結果に応じて、更新用解析キーを用いてデータベースを更新する際の更新処理の内容を決定する更新処理内容決定部24と、更新処理内容決定部24によって決定された更新処理の内容に従って、更新用解析キーおよび当該更新用解析キーに関連付けられた情報をもって、データベースを更新するデータベース更新部29と、を備えた。 (もっと読む)


【課題】 一般人が携行可能なサイズに構成されたクライアント端末装置を利用することによって、異言語を母国語とする人同士におけるコミュニケーションを円滑にするための意思疎通支援システム、及び、この意思疎通支援システムを発展させたものであって、特に、クライアント端末装置の利用者と医師や医療機関との連絡を支援するためのシステムを提供することを目的とする。
【解決手段】 クライアント端末装置のディスプレイにおいては、異言語を母国語とする人同士におけるコミュニケーションを開始する場合おいて、「事故/犯罪」「交通」「案内/確認」等、特に、頻度が高いと思われる内容をイラスト及び日本語表記と共に示した複数のアイコンが表示されている。 (もっと読む)


【課題】原稿の読者が理解可能な特徴文字列を生成可能な画像処理装置を提供する。
【解決手段】読者言語登録部320は読者言語を登録し、原稿言語登録部322は原稿言語を登録する。切替部326は、言語組合せ情報に基づいて、特徴文字列生成部40において特徴文字列を生成させるために使用される特徴文字列生成手段を切り替える。特徴文字列生成部40は、切替部326によって特徴文字列の生成に使用される特徴文字列生成手段が切り替えられ、切り替わった特徴文字列生成手段を使用して、特徴文字列を生成する。 (もっと読む)


【課題】より多様な対訳辞書を基礎として新たな対訳辞書を適切な精度で自動生成する。
【解決手段】新たな対訳辞書を作成したい第一と第二の両言語について同一又は類似の素材テキストを用意し、それぞれを第三の言語に翻訳した翻訳文の間で同一類似の語を抽出し、抽出した語に対応する第一と第二の両言語の語同士を対応付けて対訳辞書とする。これにより、適切な精度で第一→第三及び第二→第三の対訳辞書があれば、第三→第二の対訳辞書が無いか又は精度が劣る場合でも、第三の言語に翻訳した語同士の類似度に基づいて、第一→第二の対訳辞書が適切な精度で自動作成できる。 (もっと読む)


【課題】本発明は、正解データの作成コストを低減でき、正確性が高い類義性尺度を計算可能なパラメタを学習する類義性尺度用パラメタ学習装置を提供する。
【解決手段】類義性尺度学習装置100は、対訳コーパスを用いて、後記する類義関係単語対一覧および非類義関係単語対一覧を正解データとして作成する正解データ作成装置1と、正解データ作成装置1が作成した類義関係単語対一覧および非類義関係単語対一覧を用いて、単語間の類義性尺度を算出するためのパラメタを学習するパラメタ学習装置3と、パラメタ学習装置3が学習したパラメタを用いて、類義性尺度を計算する類義性尺度計算装置5とを備える。 (もっと読む)


【課題】評価を表す表現について関連性の高い表現の候補を正確に特定する。
【解決手段】情報処理装置10が備える評価表現辞書114は、評価対象を評価するための評価項目を表す語と当該評価項目に対する評価値を表す語とを含む評価表現と、当該評価表現が肯定的な表現であるか否かを表す極性と、を関連付けて記憶する。評価表現抽出部130は、評価表現辞書114を参照し、処理対象の文字列に含まれる評価表現を処理対象の文字列から抽出し、抽出した評価表現それぞれの極性を特定する。評価表現分類部140は、抽出された評価表現の間で評価対象および極性が共通するか否かに基づいて、前記抽出された評価表現を1以上のグループに分類する。出力処理部170は、同一のグループに分類された評価表現が複数ある場合に、これら複数の評価表現を互いに関連付けて関連表現記憶部180に対して出力する。 (もっと読む)


【課題】文又は節に含まれる主語と述語の組合せと同義の、接頭辞付きの単語を生成する。
【解決手段】接頭辞・述語表現対照表20は、接頭辞ごとに、接頭辞の意味を表す述語表現のリストを有する。構文意味解析部12は、対象文入力部10に入力された対象文に対して構文意味解析を実行し、主語と述語の組を抽出する。単語候補生成部14は、抽出された述語に対応する接頭辞を接頭辞・述語表現対照表20から求め、求めた各接頭辞をその主語に連結することで、主語と述語の組と同義である単語の候補を生成する。同義語判定部16は、生成された候補の中から、標準辞書22の語彙に含まれるものを選別し、これをその主語と述語の組に対応する接頭辞付き同義語として出力する。 (もっと読む)


【課題】自然文からユーザの価値判断が示されている表現を抽出する際に参照する感性辞書を効率的に編集できるように支援する技術の実現。
【解決手段】事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す極性との組合せを格納しておく感性辞書記憶部18と、複数の用語について、各用語の類義語を定義したデータが格納された類義語辞書記憶部34と、起点語が入力された場合に、この起点語をキーに類義語辞書記憶部34を検索して起点語の類義語を抽出し、各類義語をキーに類義語辞書記憶部34を検索して各類義語の類義語を抽出し、抽出された用語のリストを含む感性用語登録画面80を生成してクライアント端末58に送信し、この画面80を介してリスト中の1または複数の用語を選択する情報と、各用語の極性を指定する情報が入力された場合に、選択された用語を指定された極性に関連付けて感性辞書記憶部18に格納する辞書編集支援部38を備えた。 (もっと読む)


【課題】第1自然言語(日本語)の文章の中で省略されている用語を適切に補完して、第2自然言語(英語)に翻訳しやすいような第1自然言語(日本語)の文章を作成する。
【解決手段】ユーザ端末10から日本語による情報を入力すると、情報記録手段20が、ユーザ端末10によって入力された日本語による入力情報を記録する。そして、解析手段40が、情報記録手段20に記録されている入力情報を抽出して形態素解析を行い、用語と品詞との関係を示す修飾要素と情報記録手段20ごとに記録された入力情報とに基づいて専用辞書を作成する。そして、解析手段40は、形態素解析によって得られた第1の情報と専用辞書に記録されている第2の情報とを比較し、ユーザ端末10から入力された日本語による文章に対して付与可能な修飾要素を検出し、検出された付与可能な修飾要素に基づいて、日本語による文章の中で省略されている用語を補完する。 (もっと読む)


【課題】ユーザにとって所望の言い換えを表す用例に応じて自動的に用例集を更新することで、当該用例集を容易に管理することを可能とする。
【解決手段】入力部31は、第1の文および当該第1の文が言い換えられた第2の文を含む新規用例を入力する。言い換え生成部33は、用例集格納部22に格納されている用例集を用いて当該用例集を示す用例集情報に対応づけられている言い換え生成処理情報によって示される言い換え生成処理を実行することによって、入力部31によって入力された新規用例に含まれる第1の文が言い換えられた言い換え文を生成する。用例集更新部35は、言い換え生成部33によって生成された言い換え文が入力部31によって入力された新規用例に含まれる第2の文と同一であると判定された場合、当該新規用例を用例集格納部22に格納されている用例集に追加することによって当該用例集を更新する。 (もっと読む)


【課題】形態素解析に必要なシステム辞書に存在しない単語を拡張辞書にエントリさせることで当該解析に係る辞書の単語を拡充させる。
【解決手段】テキストデータから形態素解析の拡張辞書データを作成する辞書作成装置1であって、テキストデータからページデータを抽出するページ抽出部11と、前記ページデータからそのタイトルデータを抽出するタイトル抽出部12と、前記抽出したタイトルデータが形態素解析のシステム辞書データ16に存在しない場合に当該タイトルデータを前記形態素解析の拡張辞書のエントリデータとして格納するエントリ格納部14と、前記格納したエントリデータを形態素解析の拡張辞書データとして出力する拡張辞書データ出力部15を備える。 (もっと読む)


1 - 20 / 125