説明

ルビ付きデータ生成装置、ルビ付きデータ生成方法及びプログラム

【課題】原稿等をスキャナで読み取り生成した文字テキストデータを翻訳しルビを生成し、該文字テキストデータの列幅と対応するルビの列幅に基づき圧縮率を算出し、該文字テキストデータの表記方向に圧縮した該ルビを該文字テキストデータの近傍に付して表示し、圧縮率が所定の圧縮率を超える場合には、該ルビを縮小し複数段で表示するルビ付きデータ生成装置、ルビ付きデータ生成方法及びプログラムを提供する。
【解決手段】ルビ付きデータ生成装置1は、文字の印刷されている原稿をスキャナ11で読み取り、文字認識部12で文字認識を行いテキストデータ化し、ルビ判定部13により認識した各文字テキストデータを翻訳して、対象の文字テキストデータの列幅と、生成したルビの列幅とに基づいてルビを圧縮するための圧縮率を算出し、対象の文字テキストデータを表記する方向に各ルビを圧縮し、該文字テキストデータの近傍に付与すように表示部15を制御する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、原稿等をスキャナで読み取り生成した文字テキストデータを翻訳し対応するルビを付加する場合に、生成したルビを適切な圧縮率で圧縮し該文字テキストデータの近傍に付与し表示するルビ付きデータ生成装置、ルビ付きデータ生成方法及びプログラムに関する。
【背景技術】
【0002】
従来、原稿等をスキャナにより光学的に読み取ってテキストデータを生成して、各テキストデータに対応して翻訳を行い、各テキストデータの近傍に訳語(以下、ルビと称す)を埋め込んで出力するようなルビ付きデータ生成翻訳装置が提供されている。
【0003】
訳語を表示する際に、読み取った原稿のテキストデータ(親文字)と対応する訳語(ルビ)を互いに近辺に配置させて、ルビかけを行う。この場合、原稿のテキストデータの1単語ごとに対応させてルビをかける処理(モノルビ)と、原稿のテキストデータの所定の長さの文字列(単語の列、以下、連語と称す)に対してまとめてルビをかける処理(グループルビ)とがあり、テキストデータの同じ文字列に対してルビかけを行う場合でも、モノルビを選択するか又はグループルビかを選択するかによって、ルビの表示結果が異なってくる。
【0004】
例えば、特許文献1には、原稿を読み込んで文字データを生成し、該文字データの1単語の下に、その対応する訳語のルビを配置して表示するルビ付き機械翻訳装置が開示されている。また、読み込んだ原稿に基づく文字データの1単語の長さ(列幅)が、その対応する訳語のルビの長さ(列幅)より短い場合、該ルビの列幅を縮小して表示する技術が開示されている。
【0005】
また、特許文献2には、原稿を読み込み生成した文字データの単語1つ1つに対応してルビを生成し、該単語の近傍に付与するルビを、文表記方向と平行な方向にシフトして配置させ、翻訳対象の単語の左右隣の単語のルビスペースを利用することで、追加するルビを表示する方法が開示されている。
【0006】
また、特許文献3には、原稿に読み込み生成した文字データの1単語の下に、その対応する訳語のルビを複数段に分けてルビを配置して表示するルビ付き機械翻訳装置が開示されている。また、原稿を読み込み生成した文字データの1単語の長さが、その対応する訳語のルビの列幅より短い場合、該ルビの列を折り返して複数段にして表示する技術が開示されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平04−311262号公報
【特許文献2】特願2009−255373号公報
【特許文献3】特開平09−097252号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、これらの特許文献に示される表示では、対応する翻訳文のルビの文字列の長さが、翻訳対象の単語又は連語の長さに収まらないため、ルビを縮小して表示する場合には、ルビが極めて小さく表示されて読むことができないという課題があった。さらに、対応する訳語のルビの列幅の長さが、翻訳対象の単語又は連語の長さに収まらないため、ルビの列を折り返して複数段にして表示する場合には、原稿を読み込み生成したテキストデータの行間隔を超えて、別の翻訳対象の文字列にルビが重なってしまい判読が困難になり、可読性が損なわれるという課題がある。
【0009】
本発明は、上述のごとき実情に鑑みてなされたもので、原稿等をスキャナで読み取り生成した文字テキストデータを翻訳しルビを生成し、該文字テキストデータの列幅と対応するルビの列幅に基づき圧縮率を算出し、該文字テキストデータの表記方向に圧縮した該ルビを該文字テキストデータの近傍に付して表示し、圧縮率が所定の圧縮率を超える場合には、該ルビを縮小し複数段で表示するルビ付きデータ生成装置、ルビ付きデータ生成方法及びプログラムを提供することを目的とするものである。
【課題を解決するための手段】
【0010】
上述した課題を解決するために本発明に係るルビ付きデータ生成装置の各構成は、次の通りである。
【0011】
本発明のルビ付きデータ生成装置は、原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成装置であって、前記文字に対応して付す前記ルビを判定するルビ判定部と、前記判定に基づき、前記ルビを抽出するルビ抽出部と、前記ルビを前記文字に付与して表示する表示部と、前記文字の幅と、前記ルビの幅とを記憶する記憶部と、を備え、前記ルビ判定部は、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出し、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮することを特徴とするものである。
【0012】
また、本発明のルビ付きデータ生成装置は、前記圧縮率が所定の圧縮率を上回る場合、前記ルビのサイズを所定の縮小率で縮小し、縮小した前記ルビを複数の段にして表示することを特徴とするものである。
【0013】
また、本発明のルビ付きデータ生成装置の前記ルビ判定部は、複数の前記ルビをグループ毎に同率の圧縮率で圧縮して表示することを特徴とするものである。
【0014】
また、本発明のルビ付きデータ生成方法は、原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成方法であって、前記文字に対応して付す前記ルビを判定するルビ判定ステップと、前記判定に基づき、前記ルビを抽出するルビ抽出ステップと、前記ルビを前記文字に付与して表示する表示ステップと、前記文字の幅と、前記ルビの幅とを記憶する記憶ステップと、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出ステップと、を備え、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮するステップを備えることを特徴とするものである。
【0015】
また、本発明のルビ付きデータ生成方法は、前記圧縮率が所定の圧縮率を上回る場合、前記ルビのサイズを所定の縮小率で縮小し、縮小した前記ルビを複数の段にして表示する段表示ステップを備えることを特徴とするものである。
【0016】
また、本発明のルビ付きデータ生成方法は、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、複数の前記ルビをグループ毎に同率の圧縮率で圧縮して表示するステップを備えることを特徴とするものである。
【0017】
また、本発明のルビ付きデータ生成プログラムは、原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成方法であって、前記文字に対応して付す前記ルビを判定するルビ判定方法と、前記判定に基づき、前記ルビを抽出するルビ抽出方法と、前記ルビを前記文字に付与して表示する表示方法と、前記文字の幅と、前記ルビの幅とを記憶する記憶方法と、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出方法と、を備え、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮する圧縮方法と、を実行させることを特徴とするものである。
【発明の効果】
【0018】
本発明によれば、ルビ付きデータ生成装置は、原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成装置であって、前記文字に対応して付す前記ルビを判定するルビ判定部と、前記判定に基づき、前記ルビを抽出するルビ抽出部と、前記ルビを前記文字に付与して表示する表示部と、前記文字の幅と、前記ルビの幅とを記憶する記憶部と、を備え、前記ルビ判定部は、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出し、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮することで、各ルビを同じ圧縮率で圧縮し、文字テキストデータの幅に収まるように表示し、文字テキストデータと対応するルビを逐語的に表記するため、可読性を向上することができるという優れた効果を奏し得る。
【0019】
本発明によれば、ルビ付きデータ生成装置は、前記圧縮率が所定の圧縮率を上回る場合、前記ルビのサイズを所定の縮小率で縮小し、縮小した前記ルビを複数の段にして表示することで、所定の限界圧縮率に基づき、ルビが可視でできないほど小さく圧縮されること防ぎ、可読性を向上することができるという優れた効果を奏し得る。
【0020】
本発明によれば、ルビ付きデータ生成装置の前記ルビ判定部は、複数の前記ルビをグループ毎に同率の圧縮率で圧縮して表示することで、ルビの圧縮率を緩和してルビを付与し表示できるため、可読性を向上できるという優れた効果を奏し得る。
【0021】
本発明によれば、ルビ付きデータ生成方法は、原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成方法であって、前記文字に対応して付す前記ルビを判定するルビ判定ステップと、前記判定に基づき、前記ルビを抽出するルビ抽出ステップと、前記ルビを前記文字に付与して表示する表示ステップと、前記文字の幅と、前記ルビの幅とを記憶する記憶ステップと、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出ステップと、を備え、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮するステップを備えることで、各ルビを同じ圧縮率で圧縮し、文字テキストデータの幅に収まるように表示し、文字テキストデータと対応するルビを逐語的に表記するため、可読性を向上することができるという優れた効果を奏し得る。
【0022】
本発明によれば、ルビ付きデータ生成方法は、前記圧縮率が所定の圧縮率を上回る場合、前記ルビのサイズを所定の縮小率で縮小し、縮小した前記ルビを複数の段にして表示する段表示ステップを備えることで、所定の限界圧縮率に基づき、ルビが可視でできないほど小さく圧縮されること防ぎ、可読性を向上することができるという優れた効果を奏し得る。
【0023】
本発明によれば、ルビ付きデータ生成方法は、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、複数の前記ルビをグループ毎に同率の圧縮率で圧縮して表示するステップを備えることで、ルビの圧縮率を緩和してルビを付与し表示できるため、可読性を向上できるという優れた効果を奏し得る。
【0024】
本発明によれば、ルビ付きデータ生成プログラムは、原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成方法であって、前記文字に対応して付す前記ルビを判定するルビ判定ステップと、前記判定に基づき、前記ルビを抽出するルビ抽出ステップと、前記ルビを前記文字に付与して表示する表示ステップと、前記文字の幅と、前記ルビの幅とを記憶する記憶ステップと、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出ステップと、を備え、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮する圧縮ステップと、を実行させることで、各ルビを同じ圧縮率で圧縮し、文字テキストデータの幅に収まるように表示し、文字テキストデータと対応するルビを逐語的に表記するため、可読性を向上することができるという優れた効果を奏し得る。
【図面の簡単な説明】
【0025】
【図1】第1の実施形態に係るルビ付きデータ生成装置の構成を示すブロック図である。
【図2】(a)は、第1の実施形態に係るルビ付きデータ生成装置により生成されたルビ付きデータの一例である。(b)は、第1の実施形態に係るルビ付きデータ生成装置により生成された複数段表示されたルビ付きデータの一例である。
【図3】第1の実施形態に係るルビ付きデータ生成装置によるルビ付きデータ生成方法の処理の前半を示すフローチャートである。
【図4】第1の実施形態に係るルビ付きデータ生成装置によるルビ付きデータ生成方法の処理の後半を示すフローチャートである。
【図5】第2の実施形態に係るルビ付きデータ生成装置の構成を示すブロック図である。
【図6】(a)は、第2の実施形態に係るルビ付きデータ生成装置により生成されたルビ付きデータの一例である。(b)は、第2の実施形態に係るルビ付きデータ生成装置により生成された複数段表示されたルビ付きデータの一例である。
【図7】第2の実施形態に係るルビ付きデータ生成装置によるルビ付きデータ生成方法の処理の前半を示すフローチャートである。
【図8】第2の実施形態に係るルビ付きデータ生成装置によるルビ付きデータ生成方法の処理の後半を示すフローチャートである。
【図9】(a)は、従来のルビ付きデータ生成装置により生成されたルビ付きデータの一例である。(b)は、従来のルビ付きデータ生成装置により生成されたルビ付きデータの一例である。
【発明を実施するための形態】
【0026】
<第1の実施形態>
以下、本発明の最良の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の第1の実施形態に係るルビ付きデータ生成装置1の構成を示すブロック図である。
【0027】
第1の実施形態に係るルビ付きデータ生成装置1は、図1に示すように、画像取得部(スキャナ10)、文字認識部12、ルビ判定部13、記憶部14、表示部15を備える。
【0028】
ルビ付きデータ生成装置1は、文字の印刷されている原稿をスキャナ10で読み取り、文字認識部12で文字認識を行いテキストデータ化し、認識した各文字データ(文字テキストデータ)を翻訳して、対応する訳語のルビを生成する。更に、対象の文字テキストデータの列幅と、対応して生成されたルビの列幅とに基づいて、ルビを圧縮するための圧縮率を算出し、該圧縮率に基づき該ルビを圧縮し、該ルビを該文字データの近傍に付して該文字データと共に出力表示するものである。
【0029】
以下に、ルビ付きデータ生成装置1の各構成要素について説明する。
【0030】
画像取得部(スキャナ10)は、画像情報(画像文字)が印刷されている原稿等を読み込む。尚、通信により画像情報を受信する構成としてもよい。
【0031】
文字認識部12は、読み込まれた原稿を2値化処理(白と黒とに分離)又は濃淡の変化点から連結した画素群に対してパターンを識別し、特定の文字の文字認識を行う。文字認識部12は、認識された文字をASCIIコードに変換し、記憶部14に予め記憶されている単語データベースと照合し、ASCIIコードをデコードして文字テキストデータを生成する。
【0032】
ルビ判定部13は、文字認識部12で生成された文字テキストデータに基づき訳語となるルビを生成する。また、ルビ判定部13は、ルビの圧縮率を決定するために利用する変数を記憶する複数のレジスタを備える。該レジスタの説明は後述する。
【0033】
ルビ判定部13は、対象の文字テキストデータの表示方向の幅(以下、列幅と称す)と、訳語として対応して生成されたルビの列幅とに基づいて、対象の文字テキストデータの表示方向の幅にルビの列幅が収まるように、各ルビを圧縮するための圧縮率を算出する。算出した圧縮率に基づき、生成した各ルビを、対象の文字テキストデータを表示する方向に圧縮し、それぞれ対応する文字テキストデータの近傍(上又は下)に付与すように表示部15を制御する。
【0034】
記憶部14は、各文字テキストデータ、それに対応するルビ、文字テキストデータの列幅、ルビ列幅、文字テキストデータ数、各文字テキストデータ間の間隔幅(文字ブランク)及び各ルビ間の隔幅(ルビブランク)を記憶し、ルビ判定部13により読込み及び書込みが可能になるように構成されている。
【0035】
表示部15は、ルビ判定部13によって決定された圧縮率(具体的には、後述する最大共通圧縮率Mc)に基づき圧縮されたルビと共に文字テキストデータを表示する。
【0036】
次に、第1の実施形態に係るルビ付きデータ生成装置1によるルビ付きデータ生成方法を説明する。
【0037】
第1の実施形態に係るルビ付きデータ生成装置1は、図2(a)に示すように、対象の文字テキストデータの表示方向の幅(列幅Ow;Ow1、Ow2、Ow3)に訳語として対応して生成されたルビの列幅が収まるように各ルビの圧縮率を計算し、さらに生成した各ルビをグループ化して所定のグループ内において最大の圧縮率になるように圧縮率を算出し、それぞれのルビを文字テキストデータの近傍(図2(a)では、下方)に付し表示する。
【0038】
また、グループは、例えば、最初の文字テキストデータから、コンマ、ピリオド、セミコロン、コロン、疑問符、感嘆符等のテキストデータを区切り語として1グループとする。または、接続詞、関係代名詞及び前置詞のテキストデータのいずれか1つを区切り語として、グループを構成しても良い。さらに、単語数を予め設定し短いフレーズ毎にグループ化を行っても良い。更に、グループは、生成せれた文字テキストデータの行数ごとにグループ化を行う構成としても良い。
【0039】
ルビ付きデータ生成装置1のルビ判定部13は、ルビの圧縮率を決定するために利用する変数を記憶する複数のレジスタを備える。ルビ判定部13は、最大圧縮率Mxを記憶するレジスタR1、生成された現在のルビrの値を記憶するレジスタR2、生成された現在のルビrの列幅Rwを記憶するレジスタR3、生成されたルビrに対応する単語の文字テキストデータOを記憶するレジスタR4及び生成された現在のルビrに対応する単語の文字テキストデータの列幅Owを記憶するレジスタR5を備える。
【0040】
文字認識部12によって対象の単語の文字テキストデータが生成されると、図3に示すように、最大圧縮率Mxを100%にするようレジスタR1を設定する(ステップ10)。次に、ルビ判定部13は、対象の単語の文字テキストデータOをレジスタR4に入力する(ステップ20)。
【0041】
ルビ判定部13は、対象の単語の文字テキストデータに対応する訳語となるルビrを生成し、ルビrの値をレジスタR2に入力する(ステップ30)。続いて、ルビrの列幅をレジスタR3に入力する(ステップ40)。また、対象の単語の文字テキストデータOの列幅OwをレジスタR5に入力する(ステップ50)。
【0042】
ルビ判定部13は、生成された現在のルビrの列幅Rwと、対象の単語の文字テキストデータOの列幅Owとを比較する(ステップ60)。生成された現在のルビrの列幅Rwが対象の単語の文字テキストデータOの列幅Owより大きい場合(ステップ60、Y)、生成された文字テキストデータに対応する最適なルビの圧縮率M(M1、M2----、Ma;aは整数)を算出する(ステップ70)。
【0043】
ルビ判定部13によって算出されたルビの最適な圧縮率Mを記憶部14に記憶する(ステップ80)。
【0044】
一方、生成された現在のルビrの列幅Rwが対象の単語の文字テキストデータOの列幅Owより小さい場合(ステップ60、N)、図3のジャンプJ1を介して図4のステップ90に進む。
【0045】
さらに、ルビ判定部13は、区切り語となる文字テキストデータであるコンマ、ピリオド、セミコロン、コロン、感嘆符又は疑問符等のいずれか1つを検知しない場合又は予め設定したテキストデータの数が所定値に到達していない場合(ステップ90、N)、図4のジャンプJ2を介して図3のステップ20にリターンし、次の文字テキストデータをレジスタR4に入力する(ステップ20)。ルビ判定部13は、以後、グループを設定する区切り語を検知するまで、各テキストデータに対応するルビを生成し、テキストデータの幅とルビの列幅を比較し、各テキストデータに対応する適切な圧縮率を算出する。
【0046】
一方、区切り語となる文字テキストデータであるコンマ、ピリオド、セミコロン、コロン、感嘆符又は疑問符等のいずれか1つを検知した場合又は予め設定したテキストデータの数が所定値に到達した場合(ステップ90、Y)、ルビ判定部13は、上記のステップで対象となった複数の文字テキストデータの間隔幅(文字ブランク)をそれぞれ算出し、算出した各間隔幅を統合してグループにおける文字ブランクの総計値を算出する(ステップ100)。尚、文字テキストデータの間隔幅(文字ブランク)は、原稿をスキャナ10によって読み込む際に予め設定できる。従って、文字テキストデータの数によって総計値が算出することができる。
【0047】
さらに全文字テキストデータの幅の総計値と文字ブランクの総計値とを合計し、グループの長さである列幅(グループ幅)を算出する(ステップ110)。また、ルビ判定部13は、上記で算出したそれぞれの文字テキストデータに対応するルビの圧縮率を統合し、各対象の文字テキストデータの幅に同じ圧縮率で収まるように、該グループ幅における最大共通圧縮率Mcを算出する(ステップ120)。言い換えれば、複数のテキストデータの単語の幅に、訳語のルビが同じ圧縮率で圧縮されて収まるように最大共通圧縮率Mcを算出する。
【0048】
算出された最大共通圧縮率Mcが、予め記憶部14に記憶した表示の限界である限界圧縮率以上である場合(ステップ140、Y)、ルビ判定部13は、それぞれの文字テキストデータに対応するルビの中で、圧縮率が所定の閾値より高い値のルビのサイズを所定パーセント縮小し、図3(b)に示すように、複数段で表示する(ステップ150)。このように限界圧縮率を予め設定することで、生成されるルビが可視できないほど圧縮されてしまうことを防ぐことができる。尚、ルビのサイズを縮小する際の、縮小率(縮小パーセントテージ)は、記憶部14に予め記憶されるテーブルにより、ルビの列幅と文字テキストデータの列幅とに基づき自動的に選択される構成となっている。
【0049】
一方、算出された最大共通圧縮率Mcが、予め記憶部14に記憶した表示の限界である限界圧縮率を超えない場合(ステップ140、N)、ステップ160に進む。
【0050】
新たに算出された最大共通圧縮率McをレジスタR1に入力し(ステップ160)、該最大共通圧縮率Mcに基づき、対象となる文字テキストデータ(単語)の列幅に、訳語のルビが同じ圧縮率で圧縮されて収まるようにルビを対応する各文字テキストデータの近傍に配置し表示する(ステップ170)。
【0051】
このように、文字テキストデータの列幅に収まるように、ルビは同じ圧縮率で圧縮されるため均一に表示でき、可読性が向上する。また、文字テキストデータと対応するルビを逐語的に表記できるため利便性も向上できる。所定の限界圧縮率を設け、複数段表示することで、ルビが可視でできないほど小さく圧縮されること防ぐことができるため、可読性を向上することができる。
【0052】
図9(a)に示すように従来では、付与するルビの列幅が文字テキストデータの列幅より広い場合、表記方向にずれるか、図9(b)に示すように左右に広がってしまう恐れがあるが、本発明の第1の実施形態のルビ付きデータ生成装置1によるルビ付きデータ生成方法による各ルビは、文字テキストデータの列幅に収まるように同じ圧縮率で圧縮され表示されるため、可読性が向上し、ユーザが逐次的な訳語を一瞥で参照できるため利便性が一層向上する。
【0053】
<第2の実施形態>
【0054】
次に、本発明の第2の実施形態に係るルビ付きデータ生成装置1aについて説明する。尚、第2の実施形態に係るルビ付きデータ生成装置1aにおいて、構成要素は、ルビ判定部13aを除いて第1の実施形態と同じであることから、ルビ判定部13a以外の構成要素の説明は省略する。図5は、第2の実施形態に係るルビ付きデータ生成装置1aのブロック図である。
【0055】
ルビの生成方法として、図6(a)に示すように、対象となる文字テキストデータ(単語)の列幅に収めるといった制限を用いずに、グループ幅において、同じ圧縮率で圧縮して表示できるように圧縮率を緩和してルビを付与する。
【0056】
ルビ付きデータ生成装置1aのルビ判定部13aは、グループ幅における、複数の対象の文字テキストデータに対応して生成した各ルビに対して、同じ圧縮率を算出し、圧縮する。算出した圧縮率に基づき、生成した各ルビを、対象の文字テキストデータを表記する方向に圧縮し、該文字テキストデータの近傍(上又は下)に付与すように表示部15を制御する。
【0057】
また、ルビ判定部13aは、ルビの圧縮率を決定するために利用する変数を記憶する複数のレジスタを備える。ルビ判定部13aは、最大圧縮率Mxを記憶するレジスタR1、生成された各ルビrの値を記憶するレジスタRm、生成された各ルビrの列幅rwを記憶するレジスタRw、生成された各ルビrに対応する単語の文字テキストデータOを記憶するレジスタRo、生成された各ルビrに対応する単語の文字テキストデータの列幅Owを記憶するレジスタRwo、N個(Nは任意の整数)の文字テキストデータの各列幅Owの合計値を記憶するレジスタR6、N個のルビの各列幅rwの合計値を記憶するレジスタR7、(N−1)個の文字テキストデータの間隔幅Osの合計値を記憶するレジスタR8、(N−1)個のルビの間隔幅Rsの合計値を記憶するレジスタR9、を備える。尚、前述のレジスタRm、レジスタRw、レジスタRo及びレジスタRwoは、複数個N(Nは任意の整数)の値を記憶できるように構成される。
【0058】
原稿がスキャナ10によって読み込まれ生成される文字テキストデータを自由にレイアウトできるように、生成される文字テキストデータ間の間隔幅Osは、原稿を読み込む際に予め設定及び変更できるように構成されている。同様に各文字テキストデータに対応して生成される各ルビ間に間隔幅Rsも順次設定及び変更できるように構成されている。尚、文字テキストデータ、ルビ、文字テキストデータの列幅、ルビ列幅、文字テキストデータ数、各文字テキストデータ間の間隔幅Os(文字ブランク)及び各ルビ間の隔幅Rs(ルビブランク)は記憶部14に記憶され、順次、ルビ判定部13aにより読込み及び書込みが可能な構成とする。
【0059】
以下に、第2の実施形態に係るルビ付きデータ生成装置1aによるルビ付きデータ生成方法を説明する。
【0060】
文字認識部12によって対象の単語の文字テキストデータが生成されると、ルビ判定部13aは、図7に示すように、最大圧縮率Mxを100%にするようレジスタR1を設定する(ステップ200)。
【0061】
次に、ルビ判定部13aは、翻訳対象の単語の文字テキストデータOをレジスタRoに入力する(ステップ210)。ルビ判定部13は、対象の単語の文字テキストデータに対応する訳語となるルビrを生成し、ルビrの値をレジスタRmに入力する(ステップ220)。対象の単語の文字テキストデータOの列幅OwをレジスタWnに入力する(ステップ230)。続いて、ルビrの列幅rwをレジスタR3に入力する(ステップ240)。
【0062】
さらに、ルビ判定部13は、区切り語となる文字テキストデータであるコンマ、ピリオド、セミコロン、コロン、感嘆符又は疑問符等のいずれか1つを検知しない場合又は予め設定したテキストデータの数が所定値に到達していない場合(ステップ250、N)、ステップ210にリターンして、次の文字テキストデータに対応するルビrを生成する。以降、ルビ判定部13aは、グループを設定する区切り語を検知するまで、各テキストデータに対応するルビrを生成する。
【0063】
一方、区切り語となる文字テキストデータであるコンマ、ピリオド、セミコロン、コロン、感嘆符又は疑問符等のいずれか1つを検知した場合又は予め設定したテキストデータの数が所定値に到達した場合(ステップ250、Y)、図7のジャンプJ3を介して図8のステップ260に進み、N個の文字テキストデータの列幅Owを総計し、総計値をレジスタR6に入力する(ステップ260)。
【0064】
次に、N個のルビの各列幅rwの総計し、総計値をレジスタR7に入力する(ステップ270)。続いて、(N−1)個の文字ブランク(文字テキストデータ間の間隔幅Os)を総計し、レジスタR8に入力する(ステップ280)。更に、(N−1)個のルビブランク(ルビの間の間隔幅Rs)を総計し、レジスタR9に入力する(ステップ290)。
【0065】
N個の文字テキストデータの単語と(N−1)個の文字ブランクで構成されるグループ幅において、最大共通圧縮率Mcを算出する(ステップ300)。言い換えれば、第2の実施形態では、該グループ幅に、N個の訳語のルビが同じ圧縮率で圧縮されて収まるように最大共通圧縮率Mcを算出する。N個のルビと(N−1)個のルビブランクとにより構成するルビ列の中央Cが、N個の文字テキストデータの列の中央に一致するように配置される。
【0066】
算出された最大共通圧縮率Mcが、予め記憶部に記憶した表示の限界である限界圧縮率以上である場合(ステップ310、Y)、ルビ判定部13は、それぞれの文字テキストデータに対応するルビの中で、圧縮率が所定の閾値より高い値のルビを、図6(b)に示すように、部分的に複数段で表示する(ステップ320)。このように限界圧縮率を予め設定することで、生成されるルビが可視できないほど圧縮されてしまうことを防ぐことができ、第1の実施形態に比べて圧縮率も緩和されて可視性も向上する。
【0067】
一方、算出された最大共通圧縮率Mcが、予め記憶部に記憶した表示の限界である限界圧縮率を超えない場合(ステップ140、N)、算出された最大共通圧縮率McをレジスタR1に入力し(ステップ160)、該最大共通圧縮率Mcに基づき、グループ幅に収まるように訳語のルビが同じ圧縮率で圧縮し(ステップ340)、ルビ列の中央Cを文字テキストデータの列の中央に一致するように、ルビ列を文字テキストデータの列の近傍に配置し表示する(ステップ170)。
【0068】
このように、複数の文字テキストデータから成るグループ幅において、ルビは同じ圧縮率で圧縮されるため圧縮率が緩和されて均一に表示するためできるため、可読性が向上する。また、文字テキストデータと対応するルビを逐語的に表記できるため利便性も向上できる。所定の限界圧縮率を設け、複数段表示することで、ルビが可視でできないほど小さく圧縮されること防ぐことができるため、可読性を向上することができる。
【符号の説明】
【0069】
1、1a ルビ付きデータ生成装置
10 スキャナ
12 文字認識部
13、13a ルビ判定部
14 記憶部
15 表示部

【特許請求の範囲】
【請求項1】
原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成装置であって、
前記文字に対応して付す前記ルビを判定するルビ判定部と、
前記判定に基づき、前記ルビを抽出するルビ抽出部と、
前記ルビを前記文字に付与して表示する表示部と、
前記文字の幅と、前記ルビの幅とを記憶する記憶部と、
を備え、
前記ルビ判定部は、前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出し、前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮することを特徴とするルビ付きデータ生成装置。
【請求項2】
前記圧縮率が所定の圧縮率を上回る場合、前記ルビのサイズを所定の縮小率で縮小し、縮小した前記ルビを複数の段にして表示することを特徴とする請求項1に記載のルビ付きデータ生成装置。
【請求項3】
前記ルビ判定部は、複数の前記ルビをグループ毎に同率の圧縮率で圧縮して表示することを特徴とする請求項1に記載のルビ付きデータ生成装置。
【請求項4】
原稿を読み込み生成した文書データからなる文字を翻訳し、前記文字の近傍に対応する訳語となるルビを付して出力するルビ付きデータ生成方法であって、
前記文字に対応して付す前記ルビを判定するルビ判定ステップと、
前記判定に基づき、前記ルビを抽出するルビ抽出ステップと、
前記ルビを前記文字に付与して表示する表示ステップと、
前記文字の幅と、前記ルビの幅とを記憶する記憶ステップと、
前記文字の幅と、前記ルビの幅とに基づき前記ルビを圧縮する圧縮率を算出ステップと、
を備え、
前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、前記圧縮率に基づき前記ルビを前記文字の表記方向に圧縮するステップを備えることを特徴とするルビ付きデータ生成方法。
【請求項5】
前記圧縮率が所定の圧縮率を上回る場合、前記ルビのサイズを所定の縮小率で縮小し、縮小した前記ルビを複数の段にして表示する段表示ステップを備えることを特徴とする請求項4に記載のルビ付きデータ生成方法。
【請求項6】
前記ルビの幅が、前記ルビが付される前記文字の幅より広い場合、複数の前記ルビをグループ毎に同率の圧縮率で圧縮して表示するステップを備えることを特徴とする請求項4に記載のルビ付きデータ生成方法。
【請求項7】
請求項4から6のいずれか1項に記載のルビ付きデータ生成方法を実行させるルビ付きデータ生成プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−243181(P2012−243181A)
【公開日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2011−114403(P2011−114403)
【出願日】平成23年5月23日(2011.5.23)
【出願人】(000005049)シャープ株式会社 (33,933)
【Fターム(参考)】