説明

文書処理装置、文字データ管理装置、文書処理方法、文字データ管理方法および文書処理プログラム

【課題】個数や組み合わせの制限を受けることなく外字を利用することができ、複数プログラム間で外字を共通に利用できるようにすること。
【解決手段】文字データ管理装置210では、識別子とデータ形式の登録を受け付け、識別子および登録されたデータ形式に対応して文字データの登録を受け付ける。一方、受信部201は、識別子が埋め込まれたテキストデータを受信する。抽出部202は、テキストデータから、識別子を抽出する。特定部203は、識別子に加えデータ形式を指定することにより、文字データ管理装置から文字データの位置情報を取得する。取得部204は、文字データの位置情報から、文字データを文字データ管理装置210に要求して取得する。表示処理部205は、取得部204によって取得された文字データを用いてテキストデータを表示処理する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、文字データを取得してテキストデータを処理する文書処理装置、文字データ管理装置、文書処理方法、文字データ管理方法および文書処理プログラムに関する。
【背景技術】
【0002】
文書処理装置において、様々な非標準文字が使用される機会が増えてきている。特に外字・異体字が使用されることが多くなってきており、この外字・異体字を、複数のマシンでそれぞれ使用できるようにしておくことが望まれている。ここで、異体字や外字を含むテキストデータを複数マシン間で共有・交換するためには、フォントや交換表などのプログラム使用データを配備する必要がある。
【0003】
ここで、オペレーティングシステム環境で、ユーザが独自に生成した外字をネットワーク全体で使えるようにし、そこで、ユーザが作成した外字フォントをプリンタで認識できるファイルに変換し、それをプリンタにコピーすることによりネットワーク上の他のマシンでもこの外字を使用できるようにするものがある(たとえば、特許文献1参照。)。
【0004】
また、任意の外字の登録を受け付けて外字情報を提供し、そこで外字の字形データと文字コードを管理することにより、ネットワーク上のマシンで外字を利用できるようにするものがある(たとえば、特許文献2参照。)。
【0005】
【特許文献1】特開平11−20244号公報
【特許文献2】特開2004−355574号公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、これらのテキストデータは対応プログラムの専用形式になる。また、対応/非対応プログラム間でのテキストデータの交換に問題が生じることがある。また、外字をコード割り当てするために、個数や組み合わせに制限が生じる。
【0007】
また、文字コードを処理する方法は、OSなどのプログラムの中に閉じていたので、特殊なデータ形式が必要なプログラムは、独自に文字データを用意することになっていた。その結果、異体字・外字をプログラム間で共有することが難しくなっていたという問題が一例として挙げられる。
【0008】
この発明は、上述した従来技術による問題点を解消するため、個数や組み合わせの制限を受けることなく外字を利用することができ、複数プログラム間で外字を共通に利用することができる文書処理装置、文書処理方法、文字データ管理方法および文書処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するため、請求項1の発明にかかる文書処理装置は、識別子が埋め込まれたテキストデータを受信する受信手段と、前記受信手段によって受信されたテキストデータから、前記識別子を抽出する抽出手段と、前記抽出手段によって抽出された識別子に加え、前記テキストデータの処理に用いられるデータ形式を指定することにより、文字データ管理装置から文字データの位置情報を取得する特定手段と、前記特定手段によって特定された文字データの位置情報から、前記文字データを前記文字データ管理装置に要求して取得する取得手段と、前記取得手段によって取得された文字データを用いて前記テキストデータの表示処理を実行する表示処理手段と、を備えることを特徴とする。
【0010】
この請求項1の発明によれば、文字データ管理装置に問い合わせることにより、外字・異体字の文字データを取得することができる。それにより、様々な文字データの作成者から提供された文字データを識別子を用いることにより取得して、テキストデータの表示処理を実行することができる。
【0011】
また、請求項2の発明にかかる文書処理装置は、請求項1に記載の発明において、前記テキストデータは、異体字または外字であることを示す標識とともに、前記識別子が埋め込まれていることを特徴とする。
【0012】
また、請求項3の発明にかかる文書処理装置は、請求項2に記載の発明において、前記識別子は、広域的に一意性が保証されていることを特徴とする。
【0013】
また、請求項4の発明にかかる文書処理装置は、請求項1〜3のいずれか一つに記載の発明において、前記特定手段は、前記抽出手段により抽出された識別子に加え、前記テキストデータを処理するプログラムにおいて前記テキストデータを処理するのに必要なデータ形式を指定することにより、前記文字データの位置情報を取得することを特徴とする。
【0014】
この請求項4の発明によれば、プログラムごとに対応するデータ形式を指定して文字データの位置情報を取得することができる。そして、この位置情報から、文字データを取得することができる。それにより、たとえばプログラムがエディタやワープロの場合、フォント、プログラムがブラウザの場合、ビットマップ画像、プログラムが文字パレットの場合、読み、画数、異体字グループなど、というようにそれぞれ対応するデータ形式の文字データを取得することができ、適切な文字データの共用を実現することができる。
【0015】
また、請求項5の発明にかかる文字データ管理装置は、識別子を登録する識別子登録手段と、データ形式を登録する形式登録手段と、前記識別子登録手段によって登録された識別子および前記形式登録手段によって登録されたデータ形式に対応して文字データを登録するデータ登録手段と、識別子とデータ形式を指定した要求に対して、前記データ登録手段によって登録された対応する文字データを配信する配信手段と、を備えることを特徴とする。
【0016】
この請求項5の発明によれば、自由に文字識別子が割り当て可能になり、また登録されたデータ形式を経由して、識別子と文字データが適切に結び付けられる。それにより、識別子とデータ形式の指定に対して、文字データを配信できるようになる。
【0017】
また、請求項6の発明にかかる文書処理方法は、識別子が埋め込まれたテキストデータを受信する受信工程と、前記受信工程によって受信されたテキストデータから、前記識別子を抽出する抽出工程と、前記抽出工程によって抽出された識別子に加え、前記テキストデータの処理に用いられるデータ形式を指定することにより、文字データ管理装置から文字データの位置情報を取得する特定工程と、前記特定工程によって特定された文字データの位置情報から、前記文字データを前記文字データ管理装置に要求して取得する取得工程と、前記取得工程によって取得された文字データを用いて前記テキストデータの表示処理を実行する表示処理工程と、を含むことを特徴とする。
【0018】
この請求項6の発明によれば、文字データ管理装置に問い合わせることにより、外字・異体字の文字データを取得することができる。それにより、様々な文字データの作成者から提供された文字データを識別子を用いることにより取得して、テキストデータの表示処理を実行することができる。
【0019】
また、請求項7の発明にかかる文字データ管理方法は、識別子を登録する識別子登録工程と、データ形式を登録する形式登録工程と、前記識別子登録工程によって登録された識別子および前記形式登録工程によって登録されたデータ形式に対応して文字データを登録するデータ登録工程と、識別子とデータ形式を指定した要求に対して、前記データ登録工程によって登録された対応する文字データを配信する配信工程と、を含むことを特徴とする。
【0020】
この請求項7の発明によれば、自由に文字識別子が割り当て可能になり、また登録されたデータ形式を経由して、識別子と文字データが適切に結び付けられる。それにより、識別子とデータ形式の指定に対して、文字データを配信できるようになる。
【0021】
請求項8の発明にかかる文書処理プログラムによれば、請求項6に記載の文書処理方法または請求項7に記載の文字データ管理方法をコンピュータに実行させることを特徴とする。
【発明の効果】
【0022】
本発明にかかる文書処理装置、文字データ管理装置、文書処理方法、文字データ管理方法および文書処理プログラムによれば、環境依存することなく、多種類のプログラムで異体字・外字を一様に利用できるようになる。また、一方で異体字・外字の管理者は、無限個の異体字・外字を随時登録/公開することができる。また、プログラムに必要なデータとデータ形式を後から追加することができるので、異体字・外字への対応を容易にすることができる。
【発明を実施するための最良の形態】
【0023】
以下に添付図面を参照して、この発明による文書処理装置、文字データ管理装置、文書処理方法、文字データ管理方法および文書処理プログラムの実施の形態を詳細に説明する。
【0024】
(実施の形態)
図1は、文書処理装置のハードウエア構成の一例を示すブロック図である。図中、CPU101は装置全体を制御する。ROM102は基本入出力プログラムを記憶する。RAM103はCPU101のワークエリアとして使用される。また、HDD(ハードディスクドライブ)104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御する。HD105はHDD104の制御にしたがって書き込まれたデータを記憶する。
【0025】
また、FDD(フレキシブルディスクドライブ)106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御する。FD107は、着脱自在であり、FDD106の制御にしたがって書き込まれたデータを記憶する。また、CD−RWドライブ108はCPU101の制御にしたがってCD−RW(または、CD−R、CD−ROM)109に対するデータのリード/ライトを制御する。CD−RW109は着脱自在であり、CD−RWドライブ108の制御にしたがって書き込まれたデータを記憶する。
【0026】
また、ディスプレイ110はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示する。キーボード111は文字、数値、各種指示などの入力のための複数のキーを備える。マウス112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などを行う。
【0027】
また、ネットワークI/F113は、通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能する。バス120は上記各部を接続する。
【0028】
図2は、文書処理装置の構成を機能的に示すブロック図である。文書処理装置200は、受信部201、抽出部202、特定部203、取得部204、表示処理部205によって構成される。そして、文書処理装置200は、特定部203および取得部204により、文字データ管理装置210との間で通信処理を実行する。以上の各構成は、図1に示したCPU101が、ROM102からプログラムを読み出しRAM103をワークエリアとして使用することにより実現される。
【0029】
受信部201は、識別子が埋め込まれたテキストデータを受信する。このテキストデータは、異体字または外字であることを示す標識とともに、この識別子が埋め込まれる。
【0030】
抽出部202は、受信部201によって受信されたテキストデータから、識別子を抽出する。特定部203は、抽出部202によって抽出された識別子と、プログラム作成時に判明しているデータ形式を指定して、文字データ管理装置210に問い合わせることで、文字データの位置情報を特定する。
【0031】
取得部204は、特定部203によって特定された文字データの位置情報から、文字データ管理装置210に要求することにより取得する。具体的には、文字データ管理装置210に文字データの位置情報を指定してリクエストを送ることにより、必要な文字データを取得する。表示処理部205は、取得部204によって取得された文字データを用いてテキストデータの表示処理を実行する。文字データ管理装置210は、テキストデータを処理する文字データや、文字データと識別子との対応関係を示すデータを記憶しており、要求に応じて必要な文字データを配信する。
【0032】
図3は、文字データ管理装置で使用される各テーブルの構成を説明するブロック図である。文字データ管理装置210は、識別子データ対応テーブル300に加え、識別子テーブル301、データ形式テーブル302、文字データテーブル303を含む。一方、文書処理装置200は、プログラム310およびプログラム311を備え、それぞれ識別子データ対応テーブル300に必要な文字データを要求して取得する。ここでは、プログラム310およびプログラム311は同一の文書処理装置200に備えられているとして説明するが、別個の装置に備えられているとしてもよい。
【0033】
異体字・外字作成者、プログラム開発者、文字データ作成者は、独立にテーブルに項目を登録する。すなわち、異体字・外字作成者は識別子テーブル301に、プログラム開発者はデータ形式テーブル302に、データ作成者は文字データテーブル303に、それぞれ項目を登録する。そして、各項目の間の関係は識別子データ対応テーブル300に登録する。
【0034】
異体字・外字作成者は、グローバルにユニークな識別子を割り当てて登録する。ここで、データ形式や文字データの存在に束縛される必要はないが、識別子の重複のみ禁止する。プログラム開発者は、各形式を理解するプログラムを開発し、形式を登録する。この時点では、識別子や文字データのことを意識する必要はない。データ作成者は、ターゲットとなる形式に基づいて文字データを作成・登録する。ここで、識別子、形式、データの対応も決定しているので、この対応関係も識別子データ対応テーブル300に登録する。
【0035】
テキストでは、外字をコードではなくテーブル登録された識別子で表現する。具体的な方法としては、注釈とURIの組み合わせが考えられるが、識別子と外字が対応付けられていれば表現形式は任意のものとすることができる。この識別子は、異体字・外字を定義する人が決めるか、登録時にシステムから自動的に割り振ることにより、あらゆる文字がユニークに表現されるように決められる。
【0036】
最初の入力時には、識別子テーブル301から外字を選択することになる。選択の仕方として、文字パレットを介した文字入力が考えられるが、文字パレットは、フォント名や説明文を文字データ管理装置210から取得して表示し、ユーザが文字パレットに対して適切な外字を選択した場合に、対応する識別子を確定する。
【0037】
たとえば、字形、説明文、親文字情報を表示する文字パレットプログラムの場合、識別子X、フォント形式、説明文形式、親文字情報形式を指定し、フォント、説明文データ、親文字情報を受け取って利用する。
【0038】
プログラム310は、識別子Xを含むテキストを別のプログラム311に送信する。テキストを受信したプログラム311は、識別子Xを取り出してテキスト処理を実行する。受信側のプログラム311で、対応形式のデータが取得できない場合がある。そのため、何らかのデフォルト処理を実装しておくことが求められる。たとえば、ゲタ表示や、N/A表示などが考えられる。その場合でも、その外字をあらわすグローバルにユニークな識別子は受け取っており、テキスト自体はまったく欠損することなく受け取っている。
【0039】
なお、データ形式は、プログラムと1対1に対応するものではなく、逆に既存のデータ形式を新規プログラムで流用するほうが望ましい。さらに、テキスト自体の再利用に加えて、文字情報も再利用が促進される。ここでプログラムとは、テキスト処理をするすべてのプログラムが該当する。
【0040】
ここで、登録処理について説明する。異体字・外字登録集合は、事前に文字データ管理装置210に登録されている。そして、それぞれの異体字・外字に対してユニークな識別子が割り当てられる。プログラム開発者は、特殊画像を必要とするプログラムを開発し、その画像形式をカスタム型として文字データ管理装置210に登録する。また、別のプログラム開発者は、通常フォントを使うプログラムを開発する。ここで、基本文字データ形式のフォントを使用する。あるデータ作成会社は、プログラム開発者の特殊画像を用意する。ここで、各識別子に対して、特殊画像の型を指定して画像を登録する。
【0041】
あるプログラムにとって処理に必要となる文字データ形式が文字データ管理装置210に未登録の場合、あらかじめ新しい文字データ形式をカスタム定義して文字データ管理装置210に登録しておく。一方で、基本的な文字データ形式(フォント、画像など)の場合、そのまま利用することができる。
【0042】
文字に対応する文字データとして、フォント、読み、説明文、画数、などの情報が挙げられる。これらは、フォント会社や国語研究者などの文字データ提供者が、文字データ管理装置210に識別子とデータ形式を指定して登録する。ここで、識別子は、異体字・外字の定義ユーザが事前に登録しており、文字データ形式は基本データがあるか、プログラム作成者がカスタム型を登録しており、文字データ本体は、登録ユーザが保有している。
【0043】
図4は、異体字・外字の利用処理を説明するフローチャートである。まず、識別子をテキストデータに埋め込む(ステップS401)。処理に必要な文字データは、受け取ったプログラムに依存するので、テキストデータには含めない。識別子のみをテキストに含めることで、特定のテキストデータはどのプログラムでも、同じ意味に解釈できるようになる。次に、各プログラムにテキストデータをわたす(ステップS402)。
【0044】
次に、受け取り側のプログラムは、テキストから識別子を抽出する(ステップS403)。そして、受け取り側のプログラムは、この識別子と自分が処理可能なデータ形式を指定して、文字データ管理装置210に対して適切な文字データを要求する(ステップS404)。この要求する文字データは、識別子で示される異体字・外字を処理するのに必要な文字データであり、特殊画像型の場合、特殊画像を処理する文字データ、フォント型の場合、フォントを処理する文字データを要求する。そして、プログラムは、取得した文字データ(画像・フォントなど)で異体字・外字を適切に表示して(ステップS405)、一連の処理を終了する。
【0045】
以上説明したように、文書処理装置、文字データ管理装置、文書処理方法、文字データ管理方法および文書処理プログラムによれば、異体字・外字を処理するための文字データを外部に取り出して、識別子、データ形式と組み合わせて管理することにより、複数のプログラムでの文字データの再利用が可能になる。
【0046】
また、異体字・外字を表現するために文字コードではなく識別子を利用している。文字コードは特定範囲の数値で有限であるのに対し、識別子は任意の長さの文字列で無限に表現することができる。文字を処理するには、文字を特定し、文字を処理するための文字データを取得するという2つのステップが求められる。ここで、異体字・外字をコードではなく識別子で表現することにより、無限かつ動的な非標準文字に対応することができる。
【0047】
なお、本実施の形態で説明した文書処理方法および文字データ管理方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【産業上の利用可能性】
【0048】
以上のように、本発明にかかる文書処理装置、文字データ管理装置、文書処理方法、文字データ管理方法および文書処理プログラムは、異体字・外字そのものを管理するシステムや、異体字・外字を扱うアプリケーション全般で有用である。
【図面の簡単な説明】
【0049】
【図1】文書処理装置のハードウエア構成の一例を示すブロック図である。
【図2】文書処理装置の構成を機能的に示すブロック図である。
【図3】文字データ管理装置で使用される各テーブルの構成を説明するブロック図である。
【図4】異体字・外字の利用処理を説明するフローチャートである。
【符号の説明】
【0050】
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD−RWドライブ
109 CD−RW
110 ディスプレイ
111 キーボード
112 マウス
113 ネットワークI/F
114 通信ケーブル
120 バス
200 文書処理装置
201 受信部
202 抽出部
203 特定部
204 取得部
205 表示処理部
210 文字データ管理装置
300 識別子・形式・データ対応テーブル
301 識別子テーブル
302 データ形式テーブル
310 プログラムA
311 プログラムB

【特許請求の範囲】
【請求項1】
識別子が埋め込まれたテキストデータを受信する受信手段と、
前記受信手段によって受信されたテキストデータから、前記識別子を抽出する抽出手段と、
前記抽出手段によって抽出された識別子に加え、前記テキストデータの処理に用いられるデータ形式を指定することにより、文字データ管理装置から文字データの位置情報を取得する特定手段と、
前記特定手段によって特定された文字データの位置情報から、前記文字データを前記文字データ管理装置に要求して取得する取得手段と、
前記取得手段によって取得された文字データを用いて前記テキストデータの表示処理を実行する表示処理手段と、
を備えることを特徴とする文書処理装置。
【請求項2】
前記テキストデータは、異体字または外字であることを示す標識とともに、前記識別子が埋め込まれていることを特徴とする請求項1に記載の文書処理装置。
【請求項3】
前記識別子は、広域的に一意性が保証されていることを特徴とする請求項2に記載の文書処理装置。
【請求項4】
前記特定手段は、前記抽出手段により抽出された識別子に加えて、前記テキストデータを処理するプログラムにおいて前記テキストデータを処理するのに必要なデータ形式を指定することにより、前記文字データの位置情報を取得することを特徴とする請求項1〜3のいずれか一つに記載の文書処理装置。
【請求項5】
識別子を登録する識別子登録手段と、
データ形式を登録する形式登録手段と、
前記識別子登録手段によって登録された識別子および前記形式登録手段によって登録されたデータ形式に対応して文字データを登録するデータ登録手段と、
識別子とデータ形式を指定した要求に対して、前記データ登録手段によって登録された対応する文字データを配信する配信手段と、
を備えることを特徴とする文字データ管理装置。
【請求項6】
識別子が埋め込まれたテキストデータを受信する受信工程と、
前記受信工程によって受信されたテキストデータから、前記識別子を抽出する抽出工程と、
前記抽出工程によって抽出された識別子に加え、前記テキストデータの処理に用いられるデータ形式を指定することにより、文字データ管理装置から文字データの位置情報を取得する特定工程と、
前記特定工程によって特定された文字データの位置情報から、前記文字データを前記文字データ管理装置に要求して取得する取得工程と、
前記取得工程によって取得された文字データを用いて前記テキストデータの表示処理を実行する表示処理工程と、
を含むことを特徴とする文書処理方法。
【請求項7】
識別子を登録する識別子登録工程と、
データ形式を登録する形式登録工程と、
前記識別子登録工程によって登録された識別子および前記形式登録工程によって登録されたデータ形式に対応して文字データを登録するデータ登録工程と、
識別子とデータ形式を指定した要求に対して、前記データ登録工程によって登録された対応する文字データを配信する配信工程と、
を含むことを特徴とする文字データ管理方法。
【請求項8】
請求項6に記載の文書処理方法または請求項7に記載の文字データ管理方法をコンピュータに実行させることを特徴とする文書処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2007−179159(P2007−179159A)
【公開日】平成19年7月12日(2007.7.12)
【国際特許分類】
【出願番号】特願2005−374772(P2005−374772)
【出願日】平成17年12月27日(2005.12.27)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】