説明

文書処理装置、文書処理方法および文書処理プログラム

【課題】不特定多数にテキストデータが入手された場合でも、テキストに対する部分的な表示制御を実現すること。
【解決手段】要求部202は、所定のテキストデータについて、処理に用いる文字データを特定する特定情報を作成し、この特定情報を用いて文字データを文字データ管理装置に要求する。次に、受信部203は、要求部202による要求に応答して、文字データを文字データ管理装置210から取得する。解読部204は、文字データの利用を許可されているか否かを判定して、文字データの利用が許可されている場合に文字データを解読する。表示部205は、テキストデータのうち解読部204によって解読された部分を表示処理する。また、テキストデータのうち解読部204によって解読されなかった部分を非表示処理する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、外部の文字データを用いてテキスト処理する文書処理装置、文書処理方法および文書処理プログラムに関する。
【背景技術】
【0002】
テキストの表示処理にあたって、特定のユーザのみ閲覧できるようにする閲覧制限をかけたいという要望がある。たとえば、機密文書の場合、誤って文書が配布された場合でも、意図しない相手に対しては閲覧の制限をかけられるようにすることが望まれている。これに対し、従来、テキスト全体を暗号化することにより特定のユーザのみが閲覧できるようにしていた。この場合、テキスト全体が暗号化の対象となり、文字単位での暗号化は想定されていない。
【0003】
また、サーバからクライアントへ転送されたテキストファイルの内容が編集されたり転載されたりすることなく、そのクライアントにおいて表示できるようにするものがある(たとえば、特許文献1参照。)。
【0004】
また、記入事項のうち、特定の者以外に知られたくない情報を自分自身で暗号化して文書に記入することが出来る暗号化の仕方が記載された暗号化情報をもつ申込書を提供するものがある。ここでは、文書を局所的に暗号化するが、その局所的な部分を置換することにより実現している(たとえば、特許文献2参照。)。
【0005】
また、フォントを文字の集合を単位としてセキュリティの管理あるいは課金処理するものがある。それにより、課金を目的としてフォントだけで文字単位の表示制御を実現している。なお、文字コードは標準なので、別のフォントを使うことにより表示することができる(たとえば、特許文献3参照。)。
【0006】
【特許文献1】特開2000−163408号公報
【特許文献2】特開2000−272269号公報
【特許文献3】特開平8−212198号公報
【発明の開示】
【発明が解決しようとする課題】
【0007】
現状では、文字コードと文字コードを表示する手段がOSレベルで完結している。OS内で完結させることにより、テキストの交換可能性が保証されるが、例外的に文字を伏せ字にすることは不可能になってしまうという問題があった。すなわち、テキストを暗号化する場合、テキスト全体が暗号化の対象となり、文字単位でテキストを隠すことはできなかった。
【0008】
この発明は、上述した従来技術による問題点を解消するため、不特定多数にテキストデータが入手された場合でも、暗号キーを管理することにより、テキストに対する部分的な表示制御を実現できる文書処理装置、文書処理方法および文書処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上述した課題を解決し、目的を達成するため、請求項1の発明にかかる文書処理装置は、所定のテキストデータについて、処理に用いる文字データを特定する特定情報を作成し、前記特定情報を用いて文字データを文字データ管理装置に要求する要求手段と、前記要求手段による要求に応答して、前記文字データを前記文字データ管理装置から取得する取得手段と、前記文字データの利用が許可されているか否かを判定して、前記文字データの利用が許可されている場合に前記文字データを解読する解読手段と、前記テキストデータのうち前記解読手段によって解読された部分を表示処理し、前記テキストデータのうち前記解読手段によって解読されなかった部分を非表示処理する表示手段と、を備えることを特徴とする。
【0010】
この請求項1の発明によれば、暗号キーの付与を管理することにより、所定のテキストデータの処理に用いる暗号化された文字データは、限定されたユーザのみ解読可能にすることができる。それにより、不特定多数にテキストデータが入手された場合でも、暗号キーを管理することによりテキストに対する部分的な表示制御を実現することができる。
【0011】
また、請求項2の発明にかかる文書処理装置は、請求項1に記載の発明において、前記テキストデータは、複数の文字データにそれぞれ対応するテキストブロックを含み、前記表示手段は、解読された文字データに対応するテキストブロックを表示処理し、解読されなかった文字データに対応したテキストブロックを非表示処理することを特徴とする。
【0012】
この請求項2の発明によれば、テキストデータ中のある文字データを必要とするテキストブロックと別の文字データを必要とするテキストブロックで別々に表示制御を管理することができる。
【0013】
また、請求項3の発明にかかる文書処理装置は、請求項1または2に記載の発明において、前記表示手段は、前記テキストデータを伏せ字にすることにより非表示処理を実行することを特徴とする。
【0014】
この請求項3の発明によれば、テキストのうち公開できる部分については不特定多数のものでも閲覧できる状態にしながら、機密部分についてはエラーとすることなく機密状態とすることができ、必要な部分のみの閲覧制限を実現することができる。
【0015】
また、請求項4の発明にかかる文書処理装置は、請求項1〜3のいずれか一つに記載の発明において、前記文字データは暗号化されたデータとして登録され、前記解読手段は、あらかじめ与えられた暗号キーを用いることにより前記文字データを解読することを特徴とする。
【0016】
この請求項4の発明によれば、文字データを制限せずに配布した場合でも、許可したものに対してのみ暗号キーを与えることで、許可者のみによりテキストを閲覧できるよう閲覧制限することができる。
【0017】
また、請求項5の発明にかかる文書処理方法は、所定のテキストデータについて、処理に用いる文字データを特定する特定情報を作成し、前記特定情報を用いて文字データを文字データ管理装置に要求する要求工程と、前記要求工程による要求に応答して、前記文字データを前記文字データ管理装置から取得する取得工程と、前記文字データの利用が許可されているか否かを判定して、前記文字データの利用が許可されている場合に前記文字データを解読する解読工程と、前記テキストデータのうち前記解読工程によって解読された部分を表示処理し、前記テキストデータのうち前記解読工程によって解読されなかった部分を非表示処理する表示工程と、を含むことを特徴とする。
【0018】
この請求項5の発明によれば、暗号キーの付与を管理することにより、所定のテキストデータの処理に用いる暗号化された文字データは、限定されたユーザのみ解読可能にすることができる。それにより、不特定多数にテキストデータが入手された場合でも、暗号キーを管理することによりテキストに対する部分的な表示制御を実現することができる。
【0019】
また、請求項6の発明にかかる文書処理プログラムによれば、請求項5に記載の文書処理方法をコンピュータに実行させることができる。
【発明の効果】
【0020】
本発明にかかる文書処理装置、文書処理方法および文書処理プログラムによれば、公開された文書中で、局所的なテキストに対する表示制御を実現することができる。たとえば、伏せ字にしたい文字を識別子で表現しておき、この文字を利用するためのフォントなどの文字データのデジタルライツを適用することにより、このデジタルライツのライセンス管理で文字の伏せ字、表示を制御できるという効果を奏する。
【発明を実施するための最良の形態】
【0021】
以下に添付図面を参照して、この発明による文書処理装置、文書処理方法および文書処理プログラムの実施の形態を詳細に説明する。
【0022】
(実施の形態)
図1は、文書処理装置のハードウエア構成の一例を示すブロック図である。図中、CPU101は装置全体を制御する。ROM102は基本入出力プログラムを記憶する。RAM103はCPU101のワークエリアとして使用される。
【0023】
また、HDD(ハードディスクドライブ)104はCPU101の制御にしたがってHD(ハードディスク)105に対するデータのリード/ライトを制御する。HD105はHDD104の制御にしたがって書き込まれたデータを記憶する。
【0024】
また、FDD(フレキシブルディスクドライブ)106はCPU101の制御にしたがってFD(フレキシブルディスク)107に対するデータのリード/ライトを制御する。FD107は、着脱自在であり、FDD106の制御にしたがって書き込まれたデータを記憶する。
【0025】
また、CD−RWドライブ108はCPU101の制御にしたがってCD−RW(または、CD−R、CD−ROM)109に対するデータのリード/ライトを制御する。CD−RW109は着脱自在であり、CD−RWドライブ108の制御にしたがって書き込まれたデータを記憶する。
【0026】
また、ディスプレイ110はカーソル、メニュー、ウィンドウ、あるいは文字や画像などの各種データを表示する。キーボード111は文字、数値、各種指示などの入力のための複数のキーを備える。マウス112は各種指示の選択や実行、処理対象の選択、マウスポインタの移動などを行う。
【0027】
また、ネットワークI/F113は、通信ケーブル114を介してLANやWANなどのネットワークに接続され、当該ネットワークとCPU101とのインターフェースとして機能する。バス120は上記各部を接続する。
【0028】
図2は、文書処理装置の構成を機能的に示すブロック図である。文書処理装置200は、抽出部201、要求部202、受信部203、解読部204、表示部205によって構成される。そして、文書処理装置200は、文字データ管理装置210との間で通信処理を実行する。以上の各構成は、図1に示したCPU101が、ROM102からプログラムを読み出しRAM103をワークエリアとして使用することにより実現される。
【0029】
まず、文書処理装置200は、テキストデータを受信する。このテキストデータには、文字識別子が埋め込まれている。そして抽出部201は、受信したテキストデータから、文字識別子を抽出する。次に要求部202は、抽出部201によって抽出された文字識別子と、このテキストデータを処理可能なデータ形式を指定して文字データ管理装置210に送信する。要求部202は、このように文字識別子とデータ形式を送信することにより、文字データを文字データ管理装置210に要求する。
【0030】
受信部203は、要求部202による要求に応答して、抽出部201によって特定された文字データを文字データ管理装置210から受信する。解読部204は、受信部204が取得した文字データを解読する。このとき、解読に使用する暗号キーはあらかじめ利用者から設定される。この暗号キーにより文字データの利用が許可されているか許可されていないかを判定する。文字データの利用が許可されている場合は、文字データの解読処理を実行し、許可されていない場合は、解読処理は実行しない。
【0031】
表示部205は、テキストデータのうち解読部204によって解読された部分を表示処理する。文字データは要求部202が処理可能なデータ形式を指定しているので、正しく表示処理できることが保証される。一方、表示部205は、テキストデータのうち解読部204によって解読されなかった部分を非表示処理する。文字データの受信に失敗した場合、解読部204による暗号の解読に失敗した場合、非表示処理を実行する。ここで、たとえば、テキストデータを伏せ字にすることにより非表示処理を実行することもできる。
【0032】
テキストデータは、様々な文字データを必要とするデータの集合である場合が考えられる。たとえば、テキストデータのうち、ある部分はフォントAを必要とするデータ、ある部分はフォントBを必要とするデータである状態が考えられる。その場合、フォントAについては処理を許可し、フォントBについては処理を許可しないようにすることもできる。この場合、文書処理装置200は、フォントAのデータは解読部204で解読処理し、フォントBのデータは解読処理しない。それにより、フォントAを必要とするデータは表示処理し、フォントBを必要とするデータはたとえば伏せ字などにより非表示処理する。
【0033】
文字データ管理装置210は、文字識別子、テキストデータを処理する文字データ、文字データのデータ形式の組み合わせで、登録、検索をするシステムである。そしてこの文字データは、システムとは無関係な暗号化を施して登録されている。そしてこの文字データは、データ形式と暗号種別の組み合わせで登録される。ここで、文字データ管理装置210は、要求部202から送信された文字データの要求に応答して、受信部203に文字データを送信する。
【0034】
図3は、文字データ管理装置で使用される各テーブルの構成を説明するブロック図である。文字データ管理装置210は、識別子・形式・データ対応テーブル300に加え、識別子テーブル301、データ形式テーブル302、データ実体テーブル303を含む。一方、文書処理装置200は、プログラム310およびプログラム311を備え、それぞれ識別子・形式・データ対応テーブル300に必要な文字データを要求して取得する。ここでは、プログラム310およびプログラム311は同一の文書処理装置200に備えられているとして説明するが、別個の装置に備えられているとしてもよい。
【0035】
外字作成者、プログラム開発者、文字データ作成者は、独立にテーブルに項目を登録する。すなわち、外字作成者は識別子テーブル301に、プログラム開発者はデータ形式テーブル302に、文字データ作成者はデータ実体テーブル303にそれぞれ項目を登録する。そして、各項目の間の関係は識別子・形式・データ対応テーブル300に登録する。
【0036】
外字作成者は、グローバルにユニークな識別子を割り当てて登録する。ここで、データ形式やデータ実体の存在に束縛される必要はないが、識別子の重複のみ禁止する。プログラム開発者は、各形式を理解するプログラムを開発し、形式を登録する。この時点では、識別子やデータのことを意識する必要はない。
【0037】
文字データ作成者は、ターゲットとなる形式に基づいてデータを作成・登録する。ここで、識別子、形式、データの対応も把握しているので、この対応関係も識別子・形式・データ対応テーブル300に登録する。ここで、文字データ作成者は、暗号化されたデータを作成して登録する。この暗号化されたデータは暗号キーを用いることにより解読して利用することができる。
【0038】
プログラム310は、識別子Xを含むテキストを別のプログラム311に送信する。テキストを受信したプログラム311は、識別子Xを取り出してテキスト処理を実行する。テキスト処理を実行するにあたり、文字データが暗号データの場合、暗号キーを用いて解読処理を実行する。解読できた場合、その文字データを用いてテキスト処理を実行する。解読できない場合や暗号キーを持たない場合、その文字データの使用は許可されていないので、このテキストは伏せ字のままで表示処理する。
【0039】
また、受信側のプログラム311で、対応形式のデータが取得できない場合がある。そのため、何らかのデフォルト処理を実装しておくことが求められる。たとえば、ゲタ表示や、N/A表示などが考えられる。その場合でも、その外字をあらわすグローバルにユニークな識別子は受け取っており、テキスト自体はまったく欠損することなく受け取っている。
【0040】
なお、データ形式は、プログラムと1対1に対応するものではなく、逆に既存のデータ形式を新規プログラムで流用するほうが望ましい。さらに、テキスト自体の再利用に加えて、文字情報も再利用が促進される。ここでプログラムとは、テキスト処理をするすべてのプログラムが該当する。
【0041】
ここで、登録処理について説明する。異体字・外字登録集合は、事前に文字データ管理装置210に登録されている。そして、それぞれの異体字・外字に対してユニークな識別子が割り当てられる。プログラム開発者は、特殊画像を必要とするプログラムを開発し、その画像形式をカスタム型として文字データ管理装置210に登録する。また、別のプログラム開発者は、通常フォントを使うプログラムを開発する。ここで、基本文字データ型のフォントを使用する。あるデータ作成会社は、プログラム開発者の特殊画像を用意する。ここで、各識別子に対して、特殊画像の型を指定して画像を登録する。
【0042】
あるプログラムにとって処理に必要となる文字データ型が文字データ管理装置210に未登録の場合、あらかじめ新しい文字データ型をカスタム定義して文字データ管理装置210に登録しておく。一方で、基本的な文字データ型(フォント、画像など)の場合、そのまま利用することができる。
【0043】
文字データとして、フォント、読み、説明文、画数などの情報が挙げられる。これらは、フォント会社や国語研究者などの文字データ提供者が、文字データ管理装置210に識別子とデータ型を指定して登録する。ここで、識別子は、異体字・外字の定義ユーザが事前に登録しており、文字データ型は基本データがあるか、プログラム作成者がカスタム型を登録しており、文字データ本体は、文字データ登録ユーザが保有している。
【0044】
暗号化と解読処理について説明する。文字データ作成者は既存のDRMなどで暗号化されたデータを登録する。プログラムは、自己に割り当てられた暗号キーでデータを解読して利用する。システムの入り口で認証するのでは、フォントなどの速度が要求されるデータをローカルにコピーして利用するシステム構成が不可能になる。そこでデータ自体にアクセス制御を完結させて持たせている。その結果、文字データ管理装置210から取得できる文字データに対して、DRMなどのデジタル権利管理の仕組みが適用される。
【0045】
具体的には、ライセンス処理によるセキュリティの保護状況は次のようになる。ライセンス元は、文字データの使用権限を管理し、文字データの使用を許可する相手に対して暗号キーを配布する。ライセンス先は、ライセンス元からライセンスを受けている。したがって、ライセンス元から暗号キーが配布される。
【0046】
ここで、ライセンス先は、受けたライセンスを用いてテキスト処理を実行する。そのために文字データ管理装置210に文字データを要求して文字データを受け取る。ライセンスを受けているので、暗号キーを用いて文字データを解読し、必要なテキスト処理を実行することができる。たとえば必要なフォントを利用して機密文書を読むことができる。
【0047】
一方でクラッカーがいる場合を想定する。クラッカーは悪意の第3者で、文字データのライセンスを受けていない。しかし何らかの手段で、機密文書および文字データを入手することが考えられる。しかしその場合でも暗号キーを持っていないので、文字データを解読することができない。したがって、機密文書のテキスト処理は実行されず、機密文書を読むことができないので機密文書の機密性は確保される。
【0048】
図4は、文字単位の表示レベル制御処理を説明するフローチャートである。この処理の前に、文字データのライセンスは配布しておく。また、この文字データは、所定の暗号キーで暗号化してシステム登録しておく。たとえばフォントの場合、文字表示に必要なデータをフォントキーで暗号化してシステム登録する。プログラム作成者はフォントライセンスを利用して暗号を解読するテキスト処理プログラムを作成しておく。
【0049】
まず、異体字・外字を含むテキストを受信する(ステップS401)。次に、テキストから異体字・外字の文字識別子を抽出する(ステップS402)。この文字識別子は、テキスト中に埋め込まれている。次に、文字識別子と文字データ形式(ライセンスフォント)を指定して、文字データ管理装置210から暗号化された文字データ(フォント名、文字コード)を取得する(ステップS403)。次に、受信データを解読して、文字データを取り出す(ステップS404)。そして、取得したフォントと文字コードにより、文字を表示する(ステップS405)。そして、一連の処理を終了する。
【0050】
このように、文書の利用者や利用端末を区別して、文書自体ではなく文字単位で表示制御している。そして、データをローカルにキャッシュ、コピーすることができるので、処理の高速化が見込まれる。
【0051】
以上説明したように、文書処理装置、文書処理方法および文書処理プログラムによれば、公開された文書中で、局所的なテキストに対する表示制御を実現することができる。たとえば、異体字・外字でない場合でも、伏せ字にしたい文字を識別子で表現しておき、この文字を利用するためのフォントなどの文字データのデジタルライツを適用することにより、このデジタルライツのライセンス管理で文字の伏せ字、表示を制御できる。
【0052】
また、たとえば、表示が抑制された場合でも、検索やコピーなどは通常と同様に可能である。また、表示制御を利用したフォント販売なども考えることができる。たとえば通常はビットマップとし、購入ユーザに対しては精細フォントを提供することができる。
【0053】
なお、本実施の形態で説明した文書処理方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
【産業上の利用可能性】
【0054】
以上のように、本発明にかかる文書処理装置、文書処理方法および文書処理プログラムは、外部リソースを用いたテキスト処理にあたって有用である。また、文字データ管理装置のオプションサービスなどに利用可能である。また、誰でも検索・コピーすることが可能だが、特定ユーザしか表示することができないテキスト、たとえば個人情報や機密情報などが局所的に含まれる共有文書に応用可能である。この共有文書として、文字単位での部分的な情報保護が挙げられる。たとえば、個人情報に当たる文字列の伏せ字化などが考えられる。
【図面の簡単な説明】
【0055】
【図1】文書処理装置のハードウエア構成の一例を示すブロック図である。
【図2】文書処理装置の構成を機能的に示すブロック図である。
【図3】文字データ管理装置で使用される各テーブルの構成を説明するブロック図である。
【図4】文字単位の表示レベル制御処理を説明するフローチャートである。
【符号の説明】
【0056】
101 CPU
102 ROM
103 RAM
104 HDD
105 HD
106 FDD
107 FD
108 CD−RWドライブ
109 CD−RW
110 ディスプレイ
111 キーボード
112 マウス
113 ネットワークI/F
114 通信ケーブル
120 バス
200 文書処理装置
201 抽出部
202 要求部
203 受信部
204 解読部
205 表示部
210 文字データ管理装置
300 識別子・形式・データ対応テーブル
301 識別子テーブル
302 データ形式テーブル
303 データ実体テーブル
310 プログラムA
311 プログラムB

【特許請求の範囲】
【請求項1】
所定のテキストデータについて、処理に用いる文字データを特定する特定情報を作成し、前記特定情報を用いて文字データを文字データ管理装置に要求する要求手段と、
前記要求手段による要求に応答して、前記文字データを前記文字データ管理装置から取得する取得手段と、
前記文字データの利用が許可されているか否かを判定して、前記文字データの利用が許可されている場合に前記文字データを解読する解読手段と、
前記テキストデータのうち前記解読手段によって解読された部分を表示処理し、前記テキストデータのうち前記解読手段によって解読されなかった部分を非表示処理する表示手段と、
を備えることを特徴とする文書処理装置。
【請求項2】
前記テキストデータは、複数の文字データにそれぞれ対応するテキストブロックを含み、
前記表示手段は、解読された文字データに対応するテキストブロックを表示処理し、解読されなかった文字データに対応したテキストブロックを非表示処理することを特徴とする請求項1に記載の文書処理装置。
【請求項3】
前記表示手段は、前記テキストデータを伏せ字にすることにより非表示処理を実行することを特徴とする請求項1または2に記載の文書処理装置。
【請求項4】
前記文字データは暗号化されたデータとして登録され、前記解読手段は、あらかじめ与えられた暗号キーを用いることにより前記文字データを解読することを特徴とする請求項1〜3のいずれか一つに記載の文書処理装置。
【請求項5】
所定のテキストデータについて、処理に用いる文字データを特定する特定情報を作成し、前記特定情報を用いて文字データを文字データ管理装置に要求する要求工程と、
前記要求工程による要求に応答して、前記文字データを前記文字データ管理装置から取得する取得工程と、
前記文字データの利用が許可されているか否かを判定して、前記文字データの利用が許可されている場合に前記文字データを解読する解読工程と、
前記テキストデータのうち前記解読工程によって解読された部分を表示処理し、前記テキストデータのうち前記解読工程によって解読されなかった部分を非表示処理する表示工程と、
を含むことを特徴とする文書処理方法。
【請求項6】
請求項5に記載の文書処理方法をコンピュータに実行させることを特徴とする文書処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2007−188286(P2007−188286A)
【公開日】平成19年7月26日(2007.7.26)
【国際特許分類】
【出願番号】特願2006−5809(P2006−5809)
【出願日】平成18年1月13日(2006.1.13)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】