説明

Fターム[5B091CB09]の内容

機械翻訳 (6,566) | 入出力 (659) | 入力 (282) | 光学的文字読取り(OCR) (79)

Fターム[5B091CB09]に分類される特許

1 - 20 / 79


【課題】効率的に言語解析用の辞書を作成する辞書作成装置等を提供する。
【解決手段】未知語判定プログラム25は、記憶部から書籍のOCRデータを入力し、書誌情報データベース21と照合して作者及びジャンルを特定するとともに、処理対象の語句が、未知語か否かを判定する。未知語の語句については、辞書登録プログラム26に処理を引き渡す。辞書登録プログラム26は、作者別辞書登録プログラム26A、ジャンル別辞書登録プログラム26Bを含み、作者別辞書データベース22、ジャンル別辞書データベース23、および標準辞書データベース24に未知語を登録する。 (もっと読む)


【課題】原稿等をスキャナで読み取り生成した文字テキストデータを翻訳しルビを生成し、該文字テキストデータの列幅と対応するルビの列幅に基づき圧縮率を算出し、該文字テキストデータの表記方向に圧縮した該ルビを該文字テキストデータの近傍に付して表示し、圧縮率が所定の圧縮率を超える場合には、該ルビを縮小し複数段で表示するルビ付きデータ生成装置、ルビ付きデータ生成方法及びプログラムを提供する。
【解決手段】ルビ付きデータ生成装置1は、文字の印刷されている原稿をスキャナ11で読み取り、文字認識部12で文字認識を行いテキストデータ化し、ルビ判定部13により認識した各文字テキストデータを翻訳して、対象の文字テキストデータの列幅と、生成したルビの列幅とに基づいてルビを圧縮するための圧縮率を算出し、対象の文字テキストデータを表記する方向に各ルビを圧縮し、該文字テキストデータの近傍に付与すように表示部15を制御する。 (もっと読む)


【課題】電子ペンで記入されたストロークにより表わされる第1言語の文字列の適切な配置状態を維持したまま、翻訳した第2言語の文字列を表示させる。
【解決手段】コンピュータ装置3は、電子ペンから受信したストローク情報を第1言語の文字列の文字情報として認識し、認識された第1言語の文字列を表示する表示枠を、そのサイズ及び配置を認識し、認識された文字情報、並びに、認識された表示枠のサイズ及び配置を含む情報を端末4へ送信する。端末4は、コンピュータ装置3から送信されてくる情報を取得し、取得された情報のうち、文字情報により表わされる第1言語の文字列を、第2言語の文字列に翻訳し、第2言語への翻訳後の文字列を表示枠に対応する枠に、文字サイズを調整して表示させる。 (もっと読む)


【課題】原稿の読者が理解可能な特徴文字列を生成可能な画像処理装置を提供する。
【解決手段】読者言語登録部320は読者言語を登録し、原稿言語登録部322は原稿言語を登録する。切替部326は、言語組合せ情報に基づいて、特徴文字列生成部40において特徴文字列を生成させるために使用される特徴文字列生成手段を切り替える。特徴文字列生成部40は、切替部326によって特徴文字列の生成に使用される特徴文字列生成手段が切り替えられ、切り替わった特徴文字列生成手段を使用して、特徴文字列を生成する。 (もっと読む)


【課題】通信および計算負荷が軽減された翻訳制御装置および翻訳制御方法を提供する。
【解決手段】ネットワークを介して外部に設けられた、原稿を読み取る読取装置3および翻訳装置7と通信を行う通信部14と、通信により読取装置3に原稿を読み取らせて画像情報を取得し、画像情報のうちのテキスト領域と非テキスト領域を分離させ、テキスト領域に基づくテキスト情報を翻訳装置に送信して翻訳させ、翻訳テキスト情報を通信により取得する制御部11をもつ翻訳制御装置1。 (もっと読む)


【課題】 語句の重要度に基づいて必要な語句のみを解説する語句解説装置、語句解説方法、翻訳制御装置および翻訳制御方法を提供する。
【解決手段】 ネットワークを介して外部の装置と通信を行う通信部24と、外部からテキストデータを取得する取得手段21,24と、通信部を用いてインターネット上のウェブサイト14にアクセスして、ウェブサイトの複数の語句のアクセス回数情報(図7)を取得し、取得手段が取得したテキストデータ中からアクセス回数情報に基づいて語句を抽出し、抽出した語句に関する解説文(図8)をインターネット上のウェブサイトまたは他のウェブサイトから取得する制御部21をもつ語句解説装置。 (もっと読む)


【課題】白地以外に印刷された原画像の再現性と訳語の判読性を両立させること
【解決手段】スキャナ101が読み取った画像情報から、文字列で構成される単語を切り出し、切り出した単語に対応する訳語を、原画像中の単語に関連づけた位置に埋め込んだ第1のファイルを生成する。第1のファイルを生成する場合は、前記訳語を埋め込まない第2のファイルを生成する場合に比べて、前記画像読取手段から出力される画像データの低濃度部の画素値を大きくすることで、ハイライト部分を暗くして訳語を見やすくする。 (もっと読む)


【課題】原文画像における原文のレイアウトを保持しつつ、原文及び原文の補足説明(例えば訳文)の可読性を向上させることができる文書画像生成装置、文書画像生成方法及びコンピュータプログラムを提供する。
【解決手段】原文411の訳文421は、1行目の原文411と2行目の原文412との行間領域に配置されるが、図4(b)に示すように行間領域が狭い場合には、原文411に訳文421が重なる。このとき、原文411に係る色彩を視認性が低い色彩に変更し、訳文421に係る色彩を視認性が高い色彩に設定する。この結果、文書画像4を視認したユーザは、視認性が低い(又は高い)色彩を有する文字を読むことによって、原文411(又は訳文421)を読むことができる。即ち、原文411と訳文421とが重なっていても、原文411及び訳文421の両方の可読性が向上される。しかも、訳文421は、原文411よりも読み易い。 (もっと読む)


本発明は、データ検索および翻訳に関する。特に、本発明は、インターネットまたはデータベースから文書を検索することに関する。さら、本発明は、文書、ウェブページ、画像または音声中の言葉をある言語から別の言語に翻訳することにも関する。本発明に係る少なくとも1つのコンピュータを含むコンピュータで実施される方法は、少なくとも1つの検索語を含む検索クエリを受信する工程と、少なくとも1つの検索語に対して少なくとも1つの同義語を引き出す工程と、前記受信した検索クエリを少なくとも1つの同義語で拡張する工程と、前記拡張した検索クエリを用いて少なくとも1つの文書を検索する工程と、前記拡張したクエリによって得られた検索結果を取り出す工程と、少なくとも1つの検索語が出現する文脈に基づいて、前記同義語拡張した検索結果をランク付けする工程とを特徴とする。本発明の最良の形態は、より優れた検索結果を提供するインターネット検索エンジンであるとみなされる。 (もっと読む)


【課題】入力された情報に含まれる文字情報に対応した情報を挿入して出力する情報処理手段を提供する。
【解決手段】複数の文字情報を含む画像データを取得し、取得された前記画像データに含まれる文字情報に対応する対応情報を取得し、前記文字情報に基づいて、前記対応情報を挿入するための領域を示す領域情報を取得し、取得された前記領域情報に基づいて前記対応情報の挿入態様を決定することを特徴とする。 (もっと読む)


【課題】元の文書に追記される翻訳文に原文にあった文字サイズ等の関係性を反映させる。
【解決手段】文書画像処理装置10は、文書画像を取得し、取得された文書画像のレイアウトに基づいて、それぞれ文字列を含む1又は複数の文章領域を設定し、設定される各文章領域に含まれる文字列を認識し、各文章領域の文字サイズ及び行間に基づいて、各文章領域を1又は複数の群に分類し、認識された文字列を翻訳し、分類された群毎に翻訳された翻訳文文字列の文字サイズを決定し、文章領域毎にその文章領域が分類された群について決定された文字サイズの翻訳文文字列を配置して翻訳文追記画像を生成する。 (もっと読む)


【課題】 ユーザに対する翻訳辞書の更新の手間をなくし、常に最新の翻訳辞書を用いることが可能で、かつメモリ容量の増大のない携帯端末を得る。
【解決手段】 現在位置を検索する位置検索部3と、この検索位置に対応した国の翻訳辞書81を通信網を介して取得する辞書取得部6と、翻訳すべき文字列を撮影して文字情報に変換する文字列読取り部1及び2と、この文字情報を翻訳辞書81を用いて翻訳する制御部7とを含むことを特徴とする。 (もっと読む)


【課題】
入力言語の設定の手間を省く。
【解決手段】
入力部(14)は、文字画像を含む映像を認識部(16)に入力する。認識部(16)は、入力部(149からの映像の文字画像を認識し、この文字画像に対応する文字情報、及びその言語を示す言語情報を出力する。ユーザは、言語選択手段(12)により出力言語を選択する。言語処理部(18)は、認識手段(16)で認識された文字情報を出力言語に機械翻訳する。出力部(20)は、言語処理部(18)の翻訳結果を出力する。 (もっと読む)


【課題】画像内の文字を認識して翻訳させる場合にあって、文字以外の画像領域を文字として認識して翻訳させることを抑制する情報処理装置を提供する。
【解決手段】情報処理装置の文字認識手段は、画像内の文字を認識し、認識文字特徴取得手段は、前記文字認識手段によって認識された結果である認識文字の特徴を取得し、翻訳判断手段は、前記認識文字特徴取得手段によって取得された特徴に基づいて、前記認識文字を翻訳すべきか否かを判断する。 (もっと読む)


【課題】処理の無駄を省き、さらには翻訳結果の誤りを軽減させる。
【解決手段】文書画像処理装置10は、文書画像に含まれる文字列を認識する文字列認識部16と、文字列認識部16により認識された文字列毎に翻訳処理の対象とするか否かを判断する翻訳対象判断部18と、翻訳対象判断部18により翻訳処理の対象とすると判断された文字列について翻訳処理を行う翻訳処理部20と、を含む。 (もっと読む)


【課題】元の原稿の翻訳文を含む新たな原稿を、元原稿のバランスを崩さずに生成する。
【解決手段】文書画像処理装置10は、文書画像を文章領域に分割し、分割された各文章領域に含まれる文字を認識し、各文章領域を、その文章領域に含まれる文字のサイズ及び行間隔に基づいてグループに分類する。そして、文章領域毎に、その文章領域に含まれる文字からなる文字列を所定の言語に翻訳し、文章領域毎に、翻訳される文字列を配置した場合の文字サイズ及び行間隔を算出し、同一のグループに分類された各文章領域について算出された文字サイズ及び行間隔を、各文章領域同士の文字サイズ及び行間隔の差がそれぞれ所定値以下となるように補正する。 (もっと読む)


【課題】 使用された言語では内容の理解が困難で、翻訳が必要とされる文書を簡便かつ短時間で内容を理解できないという問題点を解決すること。
【解決手段】 本翻訳システムを利用する為のQRコードを翻訳が必要とされる文書に添付する。そのQRコードを利用しインターネットに接続する。最初の言語選択ページにて複数の選択可能な言語から精通した言語を選択する。言語選択後は自動的に翻訳された文書のページに移行し、精通した言語によって翻訳された文書の情報を、書面もしくは音声にて入手する。その結果、文書の内容を簡便かつ短時間に理解することが可能になり、本課題は解決される。 (もっと読む)


【課題】紙の無駄な消費を抑え原文の解読を容易にする制御プログラム、画像形成装置及び制御システム並びに制御方法の提供。
【解決手段】画像形成装置にハードウェア又はソフトウェアとして、原稿に記録された第1の言語の原文を所定の単位に分割する分割処理部と、所定の単位毎に原文を第2の言語に変換し翻訳文を作成する言語変換部と、各翻訳文の文字数を加算した値が閾値以下となる範囲で、連続する翻訳文を結合してパッケージ化するパッケージ化処理部と、各パッケージ化された翻訳文又は保存場所情報をコード化して記録したコードを生成するコード生成部と、各パッケージ化された翻訳文に対応する原文の位置情報とその翻訳文又は保存場所情報を記録したコードとを対応付けた補助文書や、原文の各パッケージ化された翻訳文に対応する部分にコードを付加した補助文書を印刷する印刷制御部とを設ける。 (もっと読む)


【課題】処理結果の候補から適切な処理結果を選択する言語処理装置を提供する。
【解決手段】文の構成単位と生起確率とを記憶する第1記憶部121と、係り先および係り元の構成単位で表される係り受け関係と係り先に対して係り元の構成単位が出現する条件付確率とを記憶する第2記憶部122と、処理結果の候補を受付ける入力受付部101と、処理結果の候補の係り受け構造を解析する解析部103と、係り受け構造の候補それぞれについて、文末の構成単位に対応する生起確率を第1記憶部121から取得し、係り受け関係に対応する条件付確率を第2記憶部122から取得し、すべての条件付確率の積と生起確率との積である係り受け構造の候補の生起確率を算出する算出部103aと、算出した生起確率が最大となる係り受け構造の候補を求め、求めた候補に対応する処理結果の候補を選択する選択部104とを備えた。 (もっと読む)


【課題】入力画像を構成する多くの情報を領域に分解しこれをカテゴリー別に配置することにより、読者によるスクリーニングを容易にすること。
【解決手段】入力画像から領域を抽出する文書属性判定・分解部2と、文書属性判定・分解部2で抽出された領域の文頭にしたがって各領域をカテゴリー別に分割するカテゴリー分割手段と、異なるカテゴリーに属する領域と同じカテゴリーに属する領域についてそれぞれ異なる方向に配列する領域配列手段と、を備える。 (もっと読む)


1 - 20 / 79