説明

テキストデータ表示装置

【課題】8ビットの元データに対してビット数を増やすことなく複数の文字コード表示に対応可能となり、処理を単純化することができるテキストデータ表示装置を提供することを目的とする。
【解決手段】言語選択手段と、言語選択手段の出力が第2文字コードセットに該当する言語を示す場合に、入力したテキストの文字コードの値が第2文字コードセットの第1文字コードセットと異なる非共通部分文字データの文字コードの値であるときは文字コードの値を第1文字コードセットの特定の未使用領域の文字コードの値に変換し、その他のときは文字コードの値を変換しない文字コード変換手段と、非共通部分文字データを第1文字コードセットの特定の未使用領域に割り当てた拡張第1文字コードセットを参照して文字コード変換手段の出力について該当する文字データを出力する文字データ出力手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、テキストデータ表示機能に関するものである。
【背景技術】
【0002】
複数の言語のテキストデータ表示対応を行う場合、複数の文字コードセット(以下、「コードセット」を「CS」という。)の表示に対応する必要がある。このためには、各文字CSのデータをそれぞれテーブルとして持つこととなる。しかし、異なる文字CSであっても配置されているデータは共通であることも多く、同じ文字データを異なるテーブルで重複して持つこととなりメモリ容量を無駄に消費していた。例えば西欧言語とトルコ語の両方のテキストファイルに表示対応する場合、西欧言語表示用文字CS(ISO8859−1)とトルコ語表示用文字CS(ISO8859−9)の2つのデータテーブルを持つ必要があった。図5に西欧言語表示用文字CS(ISO8859−1)の模式図を、図6にトルコ語表示用文字CS(ISO8859−9)の模式図を示す。
【0003】
しかし、ISO8859−1とISO8859−9は、(D0、DD、DE、F0、FD、FE)の6文字以外は完全に一致しているため、残りの186文字分のデータは重複となり、2つのテーブルを持つことでメモリ容量を無駄に使用することになる。
【0004】
これに対して、共通部分のデータは共用し、非共通部分を文字データのビット数を増やすことで課題を解決する手法が提案されている(例えば特許文献1参照)。この手法であれば、共通部分のデータについてはメモリ容量を無駄に消費することなく複数の文字コードセットに対応可能である。
【特許文献1】特開昭63−40317号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら上記の従来の構成では、元データである8ビットのテキストデータに対してビット数を増やす処理を施す必要があるため、データ入力から出力までの処理が複雑になり、拡張したビット分だけ中間データに要するメモリ容量が増加するという問題点を有していた。
【0006】
本発明は上記従来の問題点を解決するもので、8ビットの元データに対してビット数を増やすことなく複数の文字コード表示に対応可能となり、処理を単純化することができるテキストデータ表示装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
この目的を達成するために本発明のテキストデータ表示装置は、
言語選択手段と、
前記言語選択手段の出力が第2文字コードセットに該当する言語を示す場合に、入力したテキストの文字コードの値が第2文字コードセットの第1文字コードセットと異なる非共通部分文字データの文字コードの値であるときは前記文字コードの値を前記第1文字コードセットの特定の未使用領域の文字コードの値に変換し、その他のときは前記文字コードの値を変換しない文字コード変換手段と、
前記非共通部分文字データを前記第1文字コードセットの特定の未使用領域に割り当てた拡張第1文字コードセットを参照して前記文字コード変換手段の出力について該当する文字データを出力する文字データ出力手段とを備えた構成を有している。
【0008】
この構成によって、8ビットの元データに対してビット数を増やすことなく複数の文字コード表示に対応可能となり、処理を単純化することができるテキストデータ表示装置を提供することができる。
【発明の効果】
【0009】
以上のように本発明は、第1文字CSと第2〜第n文字CSとの非共通部分を第1文字CSの未使用領域に配置した拡張第1文字CSを用いて、共通部分については元データの値のままとし非共通部分の値のみを変換することにより、8ビットの元データに対してビット数を増やすことなく複数の文字コード表示に対応可能となり、処理を単純化することができるという優れた効果が得られる。
【発明を実施するための最良の形態】
【0010】
(実施の形態1)
図1は本発明の実施の形態1におけるテキストデータ表示装置の拡張文字CSの構成を示す図である。101は第1文字CS、102は第2文字CS、103は第2文字CS102(以下第n文字CSまで)の中で第1文字CS101と異なる文字データ、104は第1文字CS101(8ビット)の未使用領域、105は拡張第1文字CS、106は第1文字CS101と第2文字CS102との共通部分となる文字データである。
拡張第1文字CS105は文字データ103を未使用領域104に配置したものでテーブルとしてメモリに配置する。
【0011】
図2は拡張第1文字CS105の具体例である、ISO8859−1の未使用領域(80〜9F等)に、ISO8859−9の(D0、DD、DE、F0、FD、FE)の6文字分のデータを配置した拡張ISO8859−1文字CSの模式図である。
【0012】
図3は本発明の実施の形態1における複数言語を用いたテキストデータ表示装置の構成を示すブロック図である。データ読込手段300では、元テキストデータ301が読み込まれる。文字コード変換手段320は、言語切換部321、変換済コード出力部322、第2文字CS共通/非共通部分コード判別部323、・・・、第n文字CS共通/非共通部分コード判別部324、第2文字CS非共通部分コード変換部325、・・・、第n文字CS非共通部分コード変換部326で構成される。言語選択手段310では、ユーザは表示言語または表示文字コードを選択する。言語選択手段310の出力は言語切換部321の出力を第1文字CS、第2文字CS、・・・、第n文字CSの何れの処理を行わせるかを制御する。第1文字CSを使用する言語または文字コード名が選択されている場合は入力したデータが変換することなく変換済コード出力部322に送られる。
【0013】
次に第2文字CSから第n文字CSまでの何れかを使用する言語または文字コード名が選択されている場合について説明する。第2文字CSが選択されている場合は第2文字CS共通/非共通部分コード判別部323において非共通部分コードと共通部分コードとが判別される。非共通部分コードは、第2文字CS非共通部分コード変換部325において、拡張第1文字CS105の未使用領域内のコードに変換される。共通部分コードは変換されることなく変換済コード出力部322に送られる。同様に、第n文字CSが選択されている場合は第n文字CS共通/非共通部分コード判別部324において非共通部分コードと共通部分コードとが判別される。非共通部分コードは、第n文字CS非共通部分コード変換部326において、拡張第1文字CS105の未使用領域内のコードに変換される。共通部分コードは変換されることなく変換済コード出力部322に送られる。
文字データ出力手段330では、変換済コード出力部322の出力をを参照して文字データに変換し出力する。表示手段340では文字データを表示する。
【0014】
図4は本発明の実施の形態1における西欧言語とトルコ語を用いたテキストデータ表示装置の構成を示すブロック図である。図3の第1文字CSとして西欧言語表示用CS(ISO8859−1文字CS)が、第2文字CSとしてトルコ語表示用CS(ISO8859−9文字CS)が対応するものである。データ読込手段400では、光ディスク402上に記録された元テキストデータ401が読み込まれる。言語選択手段410では、ユーザは西欧言語とトルコ語のどちらを表示するかを予め選択する。文字コード変換手段420は、言語切換部421、変換済コード出力部422、共通/非共通部分コード判別部423、非共通部分コード変換部424で構成される。文字データ106(具体的には、トルコ語と西欧言語の共通部分である、(D0、DD、DE、F0、FD、FE)以外のデータ)については値は変換されることなく変換済コード出力部422に送られる。西欧言語が選択された場合には全ての文字データが文字データ106に属するので全ての文字データについて値は変換されることなく変換済コード出力部422に送られる。トルコ語が選択された場合には共通/非共通部分コード判別部423において元テキストデータ401が共通部分コードか非共通部分コードかの判別が行われる。共通部分コードについては値は変換されることなく変換済コード出力部422に送られる。非共通部分コードについては非共通部分コード変換部424においてD0→80、DD→81、DE→82、F0→83、FD→84、FE→85に変換され、その後変換済コード出力部422に送られる。ここで(80、81、82、83、84、85)は未使用領域のコードである。文字データ出力手段430では、変換済コード出力部422の出力を拡張ISO8859−1CSデータテーブル431を参照して文字データに変換し出力する。表示手段440では文字データを表示する。
【0015】
これにより、本来192文字×2テーブル分のデータが必要である西欧言語/トルコ語の両言語コード対応が、非共通部分6文字分のデータ追加と、変換済みデータを元データ同様8ビットのまま単純に文字コードの値を変換する処理を追加するのみで可能となる。
【0016】
以上のように本発明は、第1文字CSと第2〜第n文字CSとの非共通部分を、第1文字CSの未使用領域に配置することによりデータに要するメモリ容量を削減し、また共通部分については元データの値のままとし非共通部分の値のみを変換することにより複数の文字コード表示に対応可能となり、処理を単純化することができる。
【産業上の利用可能性】
【0017】
本発明のテキストデータ表示装置は、第1文字CSと第2〜第n文字CSとの非共通部分を第1文字CSの未使用領域に配置した拡張第1文字CSを用いて、共通部分については元データの値のままとし非共通部分の値のみを変換することにより、8ビットの元データに対してビット数を増やすことなく複数の文字コード表示に対応可能となり、処理を単純化することができるという優れた効果を有しているため、複数言語のテキストデータ表示装置等において有用である。
【図面の簡単な説明】
【0018】
【図1】本発明の実施の形態1におけるテキストデータ表示装置の拡張文字CSの構成を示す図
【図2】拡張ISO8859−1文字CSの模式図
【図3】本発明の実施の形態1における複数言語を用いたテキストデータ表示装置の構成を示すブロック図
【図4】本発明の実施の形態1における西欧言語とトルコ語を用いたテキストデータ表示装置の構成を示すブロック図
【図5】西欧言語表示用文字CS(ISO8859−1)の模式図
【図6】トルコ語表示用文字CS(ISO8859−9)の模式図
【符号の説明】
【0019】
101 第1文字コードセット
102 第2文字コードセット
103 第1文字コードセットと第2文字コードセットとの非共通部分
104 第1文字コードセットの未使用領域
105 拡張第1文字コードセット
106 第1文字コードセットと第2文字コードセットとの共通部分
107 拡張第1文字コードセット内に配置した第2文字コードに該当する文字データ
300,400 テキストデータ読込手段
301,401 元データ
310,410 言語選択手段
320,420 文字コード変換手段
321,421 言語切換部
322,422 変換済コード出力部
323 第2文字CS共通/非共通部分コード判別部
324 第n文字CS共通/非共通部分コード判別部
325 第2文字CS非共通部分コード変換部
326 第n文字CS非共通部分コード変換部
423 共通/非共通部分コード判別部
424 非共通部分コード変換部
330,430 文字データ出力手段
331 拡張第1文字CSデータテーブル
431 拡張ISO8859−1CSデータテーブル
340,440 表示手段

【特許請求の範囲】
【請求項1】
言語選択手段と、
前記言語選択手段の出力が第2文字コードセットに該当する言語を示す場合に、入力したテキストの文字コードの値が第2文字コードセットの第1文字コードセットと異なる非共通部分文字データの文字コードの値であるときは前記文字コードの値を前記第1文字コードセットの特定の未使用領域の文字コードの値に変換し、その他のときは前記文字コードの値を変換しない文字コード変換手段と、
前記非共通部分文字データを前記第1文字コードセットの特定の未使用領域に割り当てた拡張第1文字コードセットを参照して前記文字コード変換手段の出力について該当する文字データを出力する文字データ出力手段と、
を有するテキストデータ表示装置。

【図1】
image rotate

【図3】
image rotate

【図4】
image rotate

【図2】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−176533(P2008−176533A)
【公開日】平成20年7月31日(2008.7.31)
【国際特許分類】
【出願番号】特願2007−8808(P2007−8808)
【出願日】平成19年1月18日(2007.1.18)
【出願人】(000005821)松下電器産業株式会社 (73,050)
【Fターム(参考)】