説明

データ処理装置

【課題】マークアップ言語により構造化されたデータを適切に処理する技術を提供する。
【解決手段】文書処理装置100において、取得部70は、マークアップ言語により記述されたデータを取得する。地図コンポーネント72などの処理系は、特定のデータを入力して処理する。連携制御コンポーネント71は、取得部70が取得したデータの中から、処理系に入力するデータを抽出する。表示制御コンポーネント77は、連携制御コンポーネント71により決定された入力データを処理した処理系が出力する画面を表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書処理技術に関し、特に、マークアップ言語により記述されたデータを処理するデータ処理装置に関する。
【背景技術】
【0002】
XMLは、ネットワークなどを介して他者とデータを共有するのに適した形式として注目されており、XML文書を作成、表示、編集するためのアプリケーションが開発されている(たとえば、特許文献1参照)。XML文書は、文書型定義などにより定義されたボキャブラリ(タグセット)に基づいて作成されている。
【特許文献1】特開2001−290804号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
現在広く用いられているリレーショナルデータベースでは、一度作成されたデータ構造を運用中に変更することが一般的に困難である。しかし、XMLは、スキーマを必須としておらず、整形式(well-formed)の形態が認容されるため、XMLデータベースの拡張性は非常に高い。そのため、データベースの仕様が完全には決まっていない状態で開発を進めたり、途中でデータ構造が変化することを前提としたシステムを比較的容易に構築したりすることができる。
【0004】
しかしながら、XMLでは、任意にボキャブラリを作成することが許されており、理論上、無限に多くのボキャブラリが存在しうる。これらのボキャブラリの全てに対応して専用の表示・編集環境を提供するのは現実的ではない。従来、専用の編集環境が用意されていないボキャブラリにより記述された文書を編集する場合、テキストデータにより構成された文書のソースを直接テキストエディタなどで編集していた。
【0005】
本発明はこうした状況に鑑みてなされたものであり、その目的は、マークアップ言語により構造化されたデータを適切に処理する技術を提供することにある。
【課題を解決するための手段】
【0006】
本発明のある態様は、データ処理装置に関する。このデータ処理装置は、マークアップ言語により記述されたデータを取得する取得部と、特定のデータを入力して処理する処理系と、前記取得部が取得したデータの中から、前記処理系に入力するデータを抽出する連携制御部と、前記連携制御部により決定された入力データを処理した処理系が出力する画面を表示する表示制御部と、を備えることを特徴とする。
【0007】
複数の前記処理系が起動されるとき、前記連携制御部は、前記取得部が取得したデータ及び先に起動されている前記処理系が出力したデータの中から、後で起動された処理系に入力するデータを抽出してもよい。
【0008】
複数の前記処理系が起動されるとき、前記連携制御部は、複数の前記処理系がデータを処理する順序を変更可能としてもよい。複数の前記処理系が起動されるとき、前記表示制御部は、複数の前記処理系が出力する画面を重畳させて表示してもよい。複数の前記処理系が起動されるとき、前記表示制御部は、複数の前記処理系が出力する画面を表示する順序を変更可能としてもよい。
【0009】
前記連携制御部は、前記データの要素名、属性名、名前空間、及びデータ型のうち少なくとも1つに基づいて、前記処理系に入力するデータを抽出してもよい。前記連携制御部は、前記処理系に入力するデータの候補をユーザに提示し、ユーザから前記処理系に入力するデータの選択を受け付けることにより、前記処理系に入力するデータを決定してもよい。
【0010】
前記連携制御部は、前記データに基づいて起動する処理系を決定してもよい。
【0011】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0012】
本発明によれば、マークアップ言語により構造化されたデータを適切に処理する技術を提供することができる。
【発明を実施するための最良の形態】
【0013】
(前提技術)
図1は、前提技術に係る文書処理装置20の構成を示す。文書処理装置20は、文書内のデータが階層構造を有する複数の構成要素に分類された構造化文書を処理するが、本前提技術では構造化文書の一例としてXML文書を処理する例について説明する。文書処理装置20は、主制御ユニット22、編集ユニット24、DOMユニット30、CSSユニット40、HTMLユニット50、SVGユニット60、及び変換部の一例であるVCユニット80を備える。これらの構成は、ハードウエアコンポーネントでいえば、任意のコンピュータのCPU、メモリ、メモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
【0014】
主制御ユニット22は、プラグインのロードや、コマンド実行のフレームワークを提供する。編集ユニット24は、XML文書を編集するためのフレームワークを提供する。文書処理装置20における文書の表示及び編集機能は、プラグインにより実現されており、文書の種別に応じて必要なプラグインが主制御ユニット22又は編集ユニット24によりロードされる。主制御ユニット22又は編集ユニット24は、処理対象となるXML文書の名前空間を参照して、XML文書がいずれのボキャブラリにより記述されているかを判別し、そのボキャブラリに対応した表示又は編集用のプラグインをロードして表示や編集を実行させる。例えば、文書処理装置20には、HTML文書の表示及び編集を行うHTMLユニット50、SVG文書の表示及び編集を行うSVGユニット60など、ボキャブラリ(タグセット)ごとに表示系及び編集系がプラグインとして実装されており、HTML文書を編集するときはHTMLユニット50が、SVG文書を編集するときはSVGユニット60が、それぞれロードされる。後述するように、HTMLとSVGの双方の構成要素を含む複合文書が処理対象となっている場合は、HTMLユニット50とSVGユニット60の双方がロードされる。
【0015】
このような構成によれば、ユーザは、必要な機能のみを選択してインストールし、後から適宜機能を追加又は削除することができるので、プログラムを格納するハードディスクなどの記録媒体の記憶領域を有効に活用することができ、また、プログラム実行時にも、メモリの浪費を防ぐことができる。また、機能拡張性に優れており、開発主体としても、プラグインの形で新たなボキャブラリに対応することが可能なので開発が容易となり、ユーザとしても、プラグインの追加により容易かつ低コストにて機能を追加することができる。
【0016】
編集ユニット24は、ユーザインターフェースを介してユーザから編集指示のイベントを受け付け、そのイベントを適切なプラグインなどに通知するともに、イベントの再実行(リドゥ)又は実行の取消(アンドゥ)などの処理を制御する。
【0017】
DOMユニット30は、DOM提供部32、DOM生成部34、及び出力部36を含み、XML文書をデータとして扱うときのアクセス方法を提供するために定められた文書オブジェクトモデル(Document Object Model:DOM)に準拠した機能を実現する。DOM提供部32は、編集ユニット24に定義されているインタフェースを満たすDOMの実装である。DOM生成部34は、XML文書からDOMツリーを生成する。後述するように、処理対象となるXML文書が、VCユニット80により他のボキャブラリにマッピングされる場合は、マッピング元のXML文書に対応するソースツリーと、マッピング先のXML文書に対応するデスティネーションツリーが生成される。出力部36は、例えば編集終了時に、DOMツリーをXML文書として出力する。
【0018】
CSSユニット40は、CSS解析部42、CSS提供部44、及びレンダリング部46を含み、CSSに準拠した表示機能を提供する。CSS解析部42は、CSSの構文を解析するパーサの機能を有する。CSS提供部44は、CSSオブジェクトの実装であり、DOMツリーに対してCSSのカスケード処理を行う。レンダリング部46は、CSSのレンダリングエンジンであり、CSSを用いてレイアウトされるHTMLなどのボキャブラリで記述された文書の表示に用いられる。
【0019】
HTMLユニット50は、HTMLにより記述された文書を表示又は編集する。SVGユニット60は、SVGにより記述された文書を表示又は編集する。これらの表示/編集系は、プラグインの形で実現されており、それぞれ、文書を表示する表示部(Canvas)56、66、編集指示を含むイベントを送受信する制御部(Editlet)52、62、編集コマンドを受けてDOMに対して編集を行う編集部(Zone)54、64を備える。制御部52又は62が外部からDOMツリーの編集コマンドを受け付けると、編集部54又は64がDOMツリーを変更し、表示部56又は66が表示を更新する。これらは、MVC(Model-View-Controller)と呼ばれるフレームワークに類似する構成をとっており、概ね、表示部56及び66が「View」に、制御部52及び62が「Controller」に、編集部54及び64とDOMの実体が「Model」に、それぞれ対応する。本前提技術の文書処理装置20では、XML文書をツリー表示形式で編集するだけでなく、それぞれのボキャブラリに応じた編集を可能とする。例えば、HTMLユニット50は、HTML文書をワードプロセッサに類似した方式で編集するためのユーザインターフェースを提供し、SVGユニット60は、SVG文書を画像描画ツールに類似した方式で編集するためのユーザインターフェースを提供する。
【0020】
VCユニット80は、マッピング部82、定義ファイル取得部84、及び定義ファイル生成部86を含み、あるボキャブラリにより記述された文書を、他のボキャブラリにマッピングすることにより、マッピング先のボキャブラリに対応した表示編集用プラグインで文書を表示又は編集するためのフレームワークを提供する。本前提技術では、この機能を、ボキャブラリコネクション(Vocabulary Connection:VC)と呼ぶ。定義ファイル取得部84は、マッピングの定義を記述したスクリプトファイルを取得する。この定義ファイルは、ノードごとに、ノード間の対応(コネクション)を記述する。このとき、各ノードの要素値や属性値の編集の可否を指定してもよい。また、ノードの要素値や属性値を用いた演算式を記述してもよい。これらの機能については、後で詳述する。マッピング部82は、定義ファイル取得部84が取得したスクリプトファイルを参照して、DOM生成部34にデスティネーションツリーを生成させ、ソースツリーとデスティネーションツリーの対応関係を管理する。定義ファイル生成部86は、ユーザが定義ファイルを生成するためのグラフィカルユーザインターフェースを提供する。
【0021】
VCユニット80は、ソースツリーとデスティネーションツリーの間のコネクションを監視し、表示を担当するプラグインにより提供されるユーザインタフェースを介してユーザから編集指示を受け付けると、まずソースツリーの該当するノードを変更する。DOMユニット30が、ソースツリーが変更された旨のミューテーションイベントを発行すると、VCユニット80は、そのミューテーションイベントを受けて、ソースツリーの変更にデスティネーションツリーを同期させるべく、変更されたノードに対応するデスティネーションツリーのノードを変更する。デスティネーションツリーを表示/編集するプラグイン、例えばHTMLユニット50は、デスティネーションツリーが変更された旨のミューテーションイベントを受けて、変更されたデスティネーションツリーを参照して表示を更新する。このような構成により、少数のユーザにより利用されるローカルなボキャブラリにより記述された文書であっても、他のメジャーなボキャブラリに変換することで、文書を表示することができるとともに、編集環境が提供される。
【0022】
文書処理装置20により文書を表示又は編集する動作について説明する。文書処理装置20が処理対象となる文書を読み込むと、DOM生成部34が、そのXML文書からDOMツリーを生成する。また、主制御ユニット22又は編集ユニット24は、名前空間を参照して文書を記述しているボキャブラリを判別する。そのボキャブラリに対応したプラグインが文書処理装置20にインストールされている場合は、そのプラグインをロードして、文書を表示/編集させる。プラグインがインストールされていない場合は、マッピングの定義ファイルが存在するか否かを確認する。定義ファイルが存在する場合、定義ファイル取得部84が定義ファイルを取得し、その定義に従って、デスティネーションツリーが生成され、マッピング先のボキャブラリに対応するプラグインにより文書が表示/編集される。複数のボキャブラリを含む複合文書である場合は、後述するように、それぞれのボキャブラリに対応したプラグインにより、文書の該当箇所がそれぞれ表示/編集される。定義ファイルが存在しない場合は、文書のソース又はツリー構造を表示し、その表示画面において編集が行われる。
【0023】
図2は、処理対象となるXML文書の例を示す。このXML文書は、生徒の成績データを管理するために用いられる。XML文書のトップノードである構成要素「成績」は、配下に、生徒ごとに設けられた構成要素「生徒」を複数有する。構成要素「生徒」は、属性値「名前」と、子要素「国語」、「数学」、「理科」、「社会」を有する。属性値「名前」は、生徒の名前を格納する。構成要素「国語」、「数学」、「理科」、「社会」は、それぞれ、国語、数学、理科、社会の成績を格納する。例えば、名前が「A」である生徒の国語の成績は「90」、数学の成績は「50」、理科の成績は「75」、社会の成績は「60」である。以下、この文書で使用されているボキャブラリ(タグセット)を、「成績管理ボキャブラリ」と呼ぶ。
【0024】
本前提技術の文書処理装置20は、成績管理ボキャブラリの表示/編集に対応したプラグインを有しないので、この文書をソース表示、ツリー表示以外の方法で表示するためには、前述したVC機能が用いられる。すなわち、成績管理ボキャブラリを、プラグインが用意された別のボキャブラリ、例えば、HTMLやSVGなどにマッピングするための定義ファイルを用意する必要がある。ユーザ自身が定義ファイルを作成するためのユーザインターフェースについては後述することにして、ここでは、既に定義ファイルが用意されているとして説明を進める。
【0025】
図3は、図2に示したXML文書をHTMLで記述された表にマッピングする例を示す。図3の例では、成績管理ボキャブラリの「生徒」ノードを、HTMLにおける表(「TABLE」ノード)の行(「TR」ノード)に対応づけ、各行の第1列には属性値「名前」を、第2列には「国語」ノードの要素値を、第3列には「数学」ノードの要素値を、第4列には「理科」ノードの要素値を、第5列には「社会」ノードの要素値を、それぞれ対応付ける。これにより、図2に示したXML文書を、HTMLの表形式で表示することができる。また、これらの属性値及び要素値は、編集可能であることが指定されており、ユーザがHTMLによる表示画面上で、HTMLユニット50の編集機能により、これらの値を編集することができる。第6列には、国語、数学、理科、社会の成績の加重平均を算出する演算式が指定されており、生徒の成績の平均点が表示される。このように、定義ファイルに演算式を指定可能とすることにより、より柔軟な表示が可能となり、編集時のユーザの利便性を向上させることができる。なお、第6列は、編集不可であることが指定されており、平均点のみを個別に編集することができないようにしている。このように、マッピング定義において、編集の可否を指定可能とすることにより、ユーザの誤操作を防ぐことができる。
【0026】
図4(a)及び図4(b)は、図2に示したXML文書を図3に示した表にマッピングするための定義ファイルの例を示す。この定義ファイルは、定義ファイル用に定義されたスクリプト言語により記述される。定義ファイルには、コマンドの定義と、表示のテンプレートが記述されている。図4(a)(b)の例では、コマンドとして、「生徒の追加」と「生徒の削除」が定義されており、それぞれ、ソースツリーにノード「生徒」を挿入する操作と、ソースツリーからノード「生徒」を削除する操作が対応付けられている。また、テンプレートとして、表の第1行に「名前」、「国語」などの見出しが表示され、第2行以降に、ノード「生徒」の内容が表示されることが記述されている。ノード「生徒」の内容を表示するテンプレート中、「text-of」と記述された項は「編集可能」であることを意味し、「value-of」と記述された項は「編集不可能」であることを意味する。また、ノード「生徒」の内容を表示する行のうち、第6列には、「(src:国語 + src:数学 + src:理科 + src:社会) div 4」という計算式が記述されており、生徒の成績の平均が表示されることを意味する。
【0027】
図5は、図2に示した成績管理ボキャブラリで記述されたXML文書を、図3に示した対応によりHTMLにマッピングして表示した画面の例を示す。表90の各行には、左から、各生徒の名前、国語の成績、数学の成績、理科の成績、社会の成績、及び平均点が表示されている。ユーザは、この画面上で、XML文書を編集することができる。たとえば、第2行第3列の値を「70」に変更すると、このノードに対応するソースツリーの要素値、すなわち、生徒「B」の数学の成績が「70」に変更される。このとき、VCユニット80は、デスティネーションツリーをソースツリーに追従させるべく、デスティネーションツリーの該当箇所を変更し、HTMLユニット50が、変更されたデスティネーションツリーに基づいて表示を更新する。したがって、画面上の表においても、生徒「B」の数学の成績が「70」に変更され、更に、平均点が「55」に変更される。
【0028】
図5に示した画面には、図4(a)(b)に示した定義ファイルに定義されたように、「生徒の追加」及び「生徒の削除」のコマンドがメニューに表示される。ユーザがこれらのコマンドを選択すると、ソースツリーにおいて、ノード「生徒」が追加又は削除される。このように、本前提技術の文書処理装置20では、階層構造の末端の構成要素の要素値を編集するのみではなく、階層構造を編集することも可能である。このようなツリー構造の編集機能は、コマンドの形でユーザに提供されてもよい。また、例えば、表の行を追加又は削除するコマンドが、ノード「生徒」を追加又は削除する操作に対応づけられてもよい。また、他のボキャブラリを埋め込むコマンドがユーザに提供されてもよい。この表を入力用テンプレートとして、穴埋め形式で新たな生徒の成績データを追加することもできる。以上のように、VC機能により、HTMLユニット50の表示/編集機能を利用しつつ、成績管理ボキャブラリで記述された文書を編集することが可能となる。
【0029】
図6は、ユーザが定義ファイルを生成するために、定義ファイル生成部86がユーザに提示するグラフィカルユーザインタフェースの例を示す。画面左側の領域91には、マッピング元のXML文書がツリー表示されている。画面右側の領域92には、マッピング先のXML文書の画面レイアウトが示されている。この画面レイアウトは、HTMLユニット50により編集可能となっており、ユーザは、画面右側の領域92において、文書を表示するための画面レイアウトを作成する。そして、例えば、マウスなどのポインティングデバイスにより、画面左側の領域91に表示されたマッピング元のXML文書のノードを、画面右側の領域92に表示されたHTMLによる画面レイアウト中へドラッグ&ドロップ操作を行うことにより、マッピング元のノードと、マッピング先のノードとのコネクションが指定される。例えば、要素「生徒」の子要素である「数学」を、HTML画面の表90の第1行第3列にドロップすると、「数学」ノードと、3列目の「TD」ノードの間にコネクションが張られる。各ノードには、編集の可否が指定できるようになっている。また、表示画面中には、演算式を埋め込むこともできる。画面の編集が終わると、定義ファイル生成部86は、画面レイアウトとノード間のコネクションを記述した定義ファイルを生成する。
【0030】
XHTML、MathML、SVGなどの主要なボキャブラリに対応したビューワやエディタは既に開発されているが、図2に示した文書のようなオリジナルなボキャブラリで記述された文書に対応したビューワやエディタを開発するのは現実的でない。しかし、上記のように、他のボキャブラリにマッピングするための定義ファイルを作成すれば、ビューワやエディタを開発しなくても、VC機能を利用して、オリジナルなボキャブラリで記述された文書を表示・編集することができる。
【0031】
図7は、定義ファイル生成部86により生成された画面レイアウトの他の例を示す。図7の例では、成績管理ボキャブラリで記述されたXML文書を表示するための画面に、表90と、円グラフ93が作成されている。この円グラフ93は、SVGにより記述される。後述するように、本前提技術の文書処理装置20は、一つのXML文書内に複数のボキャブラリを含む複合文書を処理することができるので、この例のように、HTMLで記述された表90と、SVGで記述された円グラフ93とを、一つの画面上に表示することができる。
【0032】
図8は、文書処理装置20によるXML文書の編集画面の一例を示す。図8の例では、一つの画面が複数に分割されており、それぞれの領域において、処理対象となるXML文書を異なる複数の表示形式により表示している。領域94には、文書のソースが表示されており、領域95には、文書のツリー構造が表示されており、領域96には、図5に示したHTMLにより記述された表が表示されている。これらのいずれの画面上においても、文書の編集が可能であり、いずれかの画面上でユーザが編集を行うと、ソースツリーが変更され、それぞれの画面の表示を担当するプラグインが、ソースツリーの変更を反映すべく画面を更新する。具体的には、ソースツリーの変更を通知するミューテーションイベントのリスナーとして、それぞれの編集画面の表示を担当するプラグインの表示部を登録しておき、いずれかのプラグイン又はVCユニット80によりソースツリーが変更されたときに、編集画面を表示中の全ての表示部が、発行されたミューテーションイベントを受け取って画面を更新する。このとき、プラグインがVC機能により表示を行っている場合は、VCユニット80がソースツリーの変更に追従してデスティネーションツリーを変更した後、変更されたデスティネーションツリーを参照してプラグインの表示部が画面を更新する。
【0033】
例えば、ソース表示及びツリー表示を、専用のプラグインにより実現している場合は、ソース表示用プラグインとツリー表示用プラグインは、デスティネーションツリーを用いず、直接ソースツリーを参照して表示を行う。この場合、いずれかの画面において編集が行われると、ソース表示用プラグインとツリー表示用プラグインは、変更されたソースツリーを参照して画面を更新し、領域96の画面を担当しているHTMLユニット50は、ソースツリーの変更に追従して変更されたデスティネーションツリーを参照して画面を更新する。
【0034】
ソース表示及びツリー表示は、VC機能を利用して実現することもできる。すなわち、ソース、ツリー構造をHTMLによりレイアウトし、そのHTMLにXML文書をマッピングして、HTMLユニット50により表示してもよい。この場合、ソース形式、ツリー形式、表形式の3つのデスティネーションツリーが生成されることになる。いずれかの画面において編集が行われると、VCユニット80は、ソースツリーを変更した後、ソース形式、ツリー形式、表形式の3つのデスティネーションツリーをそれぞれ変更し、HTMLユニット50は、それらのデスティネーションツリーを参照して、3つの画面を更新する。
【0035】
このように、一つの画面上に複数の表示形式で文書を表示することにより、ユーザの利便性を向上させることができる。例えば、ユーザは、ソース表示又はツリー表示により文書の階層構造を把握しつつ、表90などを用いて視覚的に分かりやすい形式で文書を表示し、編集することができる。上記の例では、一つの画面を分割して複数の表示形式による画面を同時に表示したが、一つの画面に一つの表示形式による画面を表示し、表示形式をユーザの指示により切り替え可能としてもよい。この場合、主制御ユニット22が、ユーザから表示形式の切り替え要求を受け付け、各プラグインに指示して表示を切り替える。
【0036】
図9は、文書処理装置20により編集されるXML文書の他の例を示す。図9に示したXML文書では、SVG文書の「foreignObject」タグの中にXHTML文書が埋め込まれており、さらに、XHTML文書の中にMathMLで記述された数式が入っている。このような場合、編集ユニット24が、名前空間を参照して、適切な表示系に描画作業を振り分ける。図9の例では、編集ユニット24は、まず、SVGユニット60に四角形を描画させ、つづいて、HTMLユニット50にXHTML文書を描画させる。さらに、図示しないMathMLユニットに、数式を描画させる。こうして、複数のボキャブラリを包含する複合文書が適切に表示される。表示結果を図10に示す。
【0037】
文書編集中、カーソル(キャリッジ)の位置に応じて、表示されるメニューを切り替えてもよい。すなわち、カーソルが、SVG文書が表示された領域内に存在するときは、SVGユニット60が提供するメニュー、又はSVG文書をマッピングするための定義ファイルに定義されたコマンドを表示し、カーソルが、XHTML文書が表示された領域内に存在するときは、HTMLユニット50が提供するメニュー、又はXHTML文書をマッピングするための定義ファイルに定義されたコマンドを表示する。これにより、編集位置に応じて適切なユーザインターフェースを提供することができる。
【0038】
複合文書において、あるボキャブラリに対応する適切なプラグイン又はマッピング定義ファイルがなかった場合は、そのボキャブラリにより記述された部分は、ソース表示又はツリー表示されてもよい。従来、ある文書に他の文書を埋め込んだ複合文書を開くとき、埋め込まれた文書を表示するアプリケーションがインストールされていないと、その内容を表示することができなかったが、本前提技術では、表示用のアプリケーションが存在しなくても、テキストデータにより構成されたXML文書をソース表示又はツリー表示することにより内容を把握することができる。これは、テキストベースであるXMLなどの文書ならではの特徴といえる。
【0039】
データがテキストベースで記述されることの他の利点として、例えば、複合文書中の、あるボキャブラリにより記述される部分において、同一文書内の他のボキャブラリで記述された部分のデータを参照してもよい。また、文書内で検索を実行する時に、SVGなどの図に埋め込まれた文字列も検索対象とすることができる。
【0040】
あるボキャブラリにより記述された文書内に、他のボキャブラリのタグを用いてもよい。このXML文書は、妥当(valid)ではないが、整形式(well-formed)であれば、有効なXML文書として処理可能である。この場合、挿入された他のボキャブラリのタグは、定義ファイルによりマッピングされてもよい。例えば、XHTML文書中に、「重要」、「最重要」などのタグを使用し、これらのタグで囲まれた部分を強調表示してもよいし、重要度の順にソートして表示してもよい。
【0041】
図10に示した編集画面において、ユーザにより文書が編集されると、編集された部分を担当するプラグイン又はVCユニット80がソースツリーを変更する。ソースツリーには、ノードごとにミューテーションイベントのリスナーを登録できるようになっており、通常は、各ノードが属するボキャブラリに対応したプラグインの表示部又はVCユニット80がリスナーとして登録される。DOM提供部32は、ソースツリーが変更されると、変更されたノードから上位の階層へたどって、登録されたリスナーがあれば、そのリスナーへミューテーションイベントを発行する。例えば、図9に示した文書において、<html>ノードの下位のノードが変更された場合、<html>ノードにリスナーとして登録されたHTMLユニット50にミューテーションイベントが通知されるとともに、その上位の<svg>ノードにリスナーとして登録されたSVGユニット60にもミューテーションイベントが通知される。このとき、HTMLユニット50は、変更されたソースツリーを参照して表示を更新する。SVGユニット60は、自身のボキャブラリに属するノードが変更されていないので、ミューテーションイベントを無視してもよい。
【0042】
編集の内容によっては、HTMLユニット50による表示の更新に伴って、全体のレイアウトが変わる可能性がある。この場合は、画面のレイアウトを管理する構成、例えば最上位のノードの表示を担当するプラグインにより、プラグインごとの表示領域のレイアウトが更新される。例えば、HTMLユニット50による表示領域が以前より大きくなった場合、HTMLユニット50は、まず自身の担当する部分を描画して、表示領域の大きさを決定する。そして、画面のレイアウトを管理する構成に、変更後の表示領域の大きさを通知し、レイアウトの更新を依頼する。画面のレイアウトを管理する構成は、通知を受けて、プラグインごとの表示領域を再レイアウトする。こうして、編集された部分の表示が適切に更新されるとともに、画面全体のレイアウトが更新される。
【0043】
(実施の形態)
実施の形態では、複数の文書を処理する際に、文書間で、又は文書を処理する処理系の間で、データを連携させる技術を提案する。
【0044】
図11は、本実施の形態に係る文書処理装置の構成を示す。本実施の形態の文書処理装置100は、図1に示した前提技術の文書処理装置20の構成に加えて、取得部70、連携制御コンポーネント71、地図コンポーネント72、ポイントコンポーネント73、カラーコンポーネント74、経路コンポーネント75、プログレスバーコンポーネント76、及び表示制御コンポーネント77を備える。地図コンポーネント72、ポイントコンポーネント73、カラーコンポーネント74、経路コンポーネント75、プログレスバーコンポーネント76は、文書に記述されたデータを処理して様々な機能を提供する処理系である。以下、これらを総称するときは、単に「処理系」という。
【0045】
連携制御コンポーネント71は、処理系の間の連携や、処理対象となっている文書に含まれるデータの間の連携を制御する。それぞれの処理系は、所定の入力データを処理してビューを生成する機能を有している。連携制御コンポーネント71は、取得部70が取得したデータや、文書処理装置100において既に処理対象となっている別の文書に記述されたデータや、文書処理装置100において既に起動されている別の処理系が出力するデータの中から、処理系に入力するデータを抽出する。各処理系は、入力データの仕様や条件を定義しておき、連携制御コンポーネント71に通知する。連携制御コンポーネント71は、処理系が起動されたときに、その処理系の入力データとして利用可能なデータの候補を抽出する。連携制御コンポーネント71は、データの要素名、属性名、名前空間、及びデータ型のうち少なくとも1つに基づいて、処理系に入力するデータを抽出してもよい。抽出された候補の中から、いずれのデータを入力データとするかは、連携制御コンポーネント71が決定してもよいし、起動された処理系が決定してもよいし、ユーザに問い合わせて選択させてもよい。起動された処理系は、入力データに対して1回だけ適用されてもよいし、複数回ループして適用されてもよい。表示制御コンポーネント77は、入力データを処理した処理系が出力する画面を表示する。
【0046】
例えば、地図コンポーネント72は、地名を示すデータと、地形を示すデータを入力して、地図を描画する機能を有している。連携制御コンポーネント71は、これらのデータを記述するためのボキャブラリで記述された文書が取得されたときや、地図コンポーネント72の適用をユーザから要求されたときに、地図コンポーネント72を起動し、文書処理装置100が利用可能なデータの中から、地名を示すデータと、地形を示すデータとして入力可能なデータを抽出し、地図コンポーネント72に入力する。これにより、地図コンポーネント72が地図を描画することができる。
【0047】
また、カラーコンポーネント74は、色を決定するための条件を示すデータと、決定された色で描画する図形を示すデータを入力して、条件に応じた色で図形を描画する機能を有している。例えば、ある土地の地名を示すデータと、地形を示すデータと、人口を示すデータとが別の文書に記述されている場合であっても、連携制御コンポーネント71が、人口を示すデータと、人口に応じて色を決定するための条件を示すデータと、地形を示すデータとを抽出してカラーコンポーネント74に入力すると、カラーコンポーネント74は、土地ごとに、人口に応じて決定された色で地図を着色することができる。
【0048】
プログレスバーコンポーネント76は、起動されている処理系に時系列的なデータが入力されているとき、時間軸に沿って入力データを切り替える機能を有している。プログレスバーコンポーネント76が、入力データを過去又は未来へ切り替える指示を発すると、時系列的なデータを入力している処理系は、入力データを指示されたように変更して、再度処理を実行して表示を更新する。
【0049】
処理系は、入力データを処理した結果や、処理対象となる文書に記述されたデータなどを、他の処理系が入力データとして利用できるように出力する機能を有していてもよい。この場合、各処理系は、出力データの仕様や条件を定義しておき、連携制御コンポーネント71に通知しておく。処理系は、自身の処理が終了したときに、出力データをDOMとして生成しておいてもよいし、連携制御コンポーネント71から出力を要求されたときに出力データを生成してもよい。出力データは、実体データとして後続の処理系に与えられてもよいし、出力データへのポインタのみが与えられてもよい。後者の場合、同一のDOMを複数の処理系が参照してもよく、各処理系は、前提技術で説明したVC機能と同様に、参照元のDOMのデータを自身の入力データにマッピングして処理してもよい。各処理系が、生成したビューを介してデータの編集を受け付ける場合、前提技術で説明したように、参照元のDOMを変更するよう参照元のDOMを管理する処理系に編集イベントを通知し、DOMが変更されたことを示すミューテーションイベントを受けて、参照元のDOMの変更を自身が管理するDOMへ反映させ、ビューを更新してもよい。
【0050】
処理系は、本実施の形態で説明するデータ連携機能のために専用に開発されたものであってもよいし、前提技術で説明した各タグセットを処理するための処理系であってもよい。後者の場合、処理系が、他の文書のデータ又は他の処理系が出力するデータを入力データとして受付可能とするために、処理系のインタフェースを拡張してもよい。または、連携制御コンポーネントが、前提技術で説明したVC技術と同様に、他の文書のデータ又は他の処理系が出力するデータを、処理系が処理可能なタグセットにマッピングして処理系へ供給してもよい。
【0051】
処理対象となる文書が開かれていない状態では、連携制御コンポーネント71は、無地のデータシートを表示する。ユーザが、このデータシートに文書をドロップするなどして、処理対象となる文書を開くと、連携制御コンポーネント71の管理のもとで、文書を処理する処理系が起動される。
【0052】
連携制御コンポーネント71は、データシート上で開かれた文書や、データシート上で起動された処理系に対して、レイヤを割り当てて管理する。連携制御コンポーネント71は、データシート上で文書が開かれると、その文書に対して新たにレイヤを生成し、レイヤ間でのデータの授受を管理する。表示制御コンポーネント77は、複数の処理系が起動されて複数のレイヤが生成されたとき、それらの処理系が出力する各レイヤの画面を重畳させて表示してもよい。各レイヤには、表示/非表示を切り替えるためのチェックボックスを設けてもよい。この場合、表示制御コンポーネント77は、非表示とされたレイヤの表示を担当する処理系が生成したビューを非表示とする。レイヤには、データシート上で開かれた順にタブが設けられ、タブにより処理対象となるアクティブなレイヤを切換可能としてもよい。また、タブのドラッグ&ドロップによりレイヤの順番を入替可能としてもよい。このとき、表示制御コンポーネント77は、画面を表示する順序を入れ替えてもよく、連携制御コンポーネント71は、データを処理する順序やデータの結合順序を入れ替えてもよい。データの結合順序と画面の表示順序は別に管理されてもよい。
【0053】
1つのレイヤに複数の文書又は処理系が割り当てられてもよい。例えば、複数の文書に記述されたデータをグループ化して1つのレイヤに割り当ててもよい。また、複数の処理系をグループ化して1つのレイヤに割り当て、文書に記述されたデータを複数の処理系により処理させてもよい。複数の処理系をグループ化して割り当てたレイヤを保存して汎用的に利用したり、そのように保存された複数のレイヤを更に組み合わせて利用したりしてもよい。
【0054】
データ連携のプラットフォームとなるデータシートは、連携制御コンポーネント71が処理対象とするボキャブラリ(以下、このボキャブラリの名前空間接頭辞を「cascadexmlObject」とする)で記述される。このデータシートを示すソース文書には、処理対象としてデータシート上で開かれた文書のパスと名称を格納する要素と、各レイヤに対応する文書の識別子を格納する要素が記述される。したがって、データシート上で組み合わされた複数の文書や複数の処理系は、ソース文書に記録されるので、このソース文書を開くと、データが連携されたデータシートが復元される。
【0055】
データシート上で開かれた文書に記述されたデータは、ソース文書に追加されてもよいし、各文書のDOMとして別に管理されてもよい。前者の場合は、ソース文書のデータ量が大きくなるが、データシートを開くときに必要なデータが全てソース文書に含まれるので、データの受け渡しの際などに便利である。
【0056】
連携制御コンポーネント71は、複数の文書を取得し、それらの文書に記述されたデータの間で連携可能な組合せを抽出し、ユーザに提示してもよい。ユーザが、複数の文書に記述された様々なデータを分析するとき、データ間の相関関係や因果関係などを視覚的に分かりやすく提示することが可能な支援技術が求められるが、予め定義されたデータ間の相関関係を視覚化しても、その枠から脱却することはできず、新たな発見は望めない。しかし、参照すべき文書の数やデータの数が多くなると、データの組合せは指数関数的に増大し、もはや人間が全ての組合せについて分析することは不可能である。そこで、連携制御コンポーネント71は、与えられた文書に記述されたデータを様々に連携させ、相関の高い組合せや、因果関係がありそうな組合せを抽出して提示する。このとき、連携制御コンポーネント71は、要素名や属性名の類似度、階層構造の類似度、データ型の類似度などを参照して、データの組合せに対して重み付けを行ってもよい。
【0057】
連携制御コンポーネント71は、文書処理装置100にインストールされていて利用可能な処理系の入力データとして、与えられた文書に含まれる複数のデータを様々な組合せで入力させ、処理系により生成される表示画面をユーザに提示してもよい。連携制御コンポーネント71は、データに基づいて起動する処理系を決定してもよい。処理系が複数ある場合には、処理系も様々に組み合わせてもよい。また、1つの処理系を複数回適用させてもよい。複数のデータと処理系を様々に組合せながら順次処理を進めていくことで、事象のシミュレータとして機能させることもできる。また、後からデータや処理系を差し替えてもよい。このように、データや処理系を様々に連携させることにより、ユーザの意思決定を支援することができる。
【0058】
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0059】
実施の形態では、XML文書を処理する例について説明したが、本実施の形態の文書処理装置100は、他のマークアップ言語、例えば、SGML、HTMLなどで記述された文書も同様に処理可能である。
【図面の簡単な説明】
【0060】
【図1】前提技術に係る文書処理装置の構成を示す図である。
【図2】文書処理装置により編集されるXML文書の例を示す図である。
【図3】図2に示したXML文書をHTMLで記述された表にマッピングする例を示す図である。
【図4(a)】図2に示したXML文書を図3に示した表にマッピングするための定義ファイルの例を示す図である。
【図4(b)】図2に示したXML文書を図3に示した表にマッピングするための定義ファイルの例を示す図である。
【図5】図2に示したXML文書を、図3に示した対応によりHTMLにマッピングして表示した画面の例を示す図である。
【図6】ユーザが定義ファイルを生成するために、定義ファイル生成部がユーザに提示するグラフィカルユーザインターフェースの例を示す図である。
【図7】定義ファイル生成部により生成された画面レイアウトの他の例を示す図である。
【図8】文書処理装置によるXML文書の編集画面の一例を示す図である。
【図9】文書処理装置により編集されるXML文書の他の例を示す図である。
【図10】図9に示した文書を表示した画面の例を示す図である。
【図11】実施の形態に係る文書処理装置の構成を示す図である。
【符号の説明】
【0061】
20 文書処理装置、22 主制御ユニット、24 編集ユニット、30 DOMユニット、32 DOM提供部、34 DOM生成部、36 出力部、40 CSSユニット、42 CSS解析部、44 CSS提供部、46 レンダリング部、50 HTMLユニット、52,62 制御部、54,64 編集部、56,66 表示部、60 SVGユニット、70 取得部、71 連携制御コンポーネント、72 地図コンポーネント、73 ポイントコンポーネント、74 カラーコンポーネント、75 経路コンポーネント、76 プログレスバーコンポーネント、77 表示制御コンポーネント、80 VCユニット、82 マッピング部、84 定義ファイル取得部、86 定義ファイル生成部、100 文書処理装置。

【特許請求の範囲】
【請求項1】
マークアップ言語により記述されたデータを取得する取得部と、
特定のデータを入力して処理する処理系と、
前記取得部が取得したデータの中から、前記処理系に入力するデータを抽出する連携制御部と、
前記連携制御部により決定された入力データを処理した処理系が出力する画面を表示する表示制御部と、
を備えることを特徴とするデータ処理装置。
【請求項2】
複数の前記処理系が起動されるとき、前記連携制御部は、前記取得部が取得したデータ及び先に起動されている前記処理系が出力したデータの中から、後で起動された処理系に入力するデータを抽出することを特徴とする請求項1に記載のデータ処理装置。
【請求項3】
複数の前記処理系が起動されるとき、前記連携制御部は、複数の前記処理系がデータを処理する順序を変更可能とすることを特徴とする請求項1又は2に記載のデータ処理装置。
【請求項4】
複数の前記処理系が起動されるとき、前記表示制御部は、複数の前記処理系が出力する画面を重畳させて表示することを特徴とする請求項1から3のいずれかに記載のデータ処理装置。
【請求項5】
複数の前記処理系が起動されるとき、前記表示制御部は、複数の前記処理系が出力する画面を表示する順序を変更可能とすることを特徴とする請求項4に記載のデータ処理装置。
【請求項6】
前記連携制御部は、前記データの要素名、属性名、名前空間、及びデータ型のうち少なくとも1つに基づいて、前記処理系に入力するデータを抽出することを特徴とする請求項1から5のいずれかに記載のデータ処理装置。
【請求項7】
前記連携制御部は、前記処理系に入力するデータの候補をユーザに提示し、ユーザから前記処理系に入力するデータの選択を受け付けることにより、前記処理系に入力するデータを決定することを特徴とする請求項1から6のいずれかに記載のデータ処理装置。
【請求項8】
前記連携制御部は、前記データに基づいて起動する処理系を決定することを特徴とする請求項1から7のいずれかに記載のデータ処理装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4(a)】
image rotate

【図4(b)】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2008−97215(P2008−97215A)
【公開日】平成20年4月24日(2008.4.24)
【国際特許分類】
【出願番号】特願2006−276770(P2006−276770)
【出願日】平成18年10月10日(2006.10.10)
【出願人】(390024350)株式会社ジャストシステム (123)
【Fターム(参考)】