説明

電子帳票システムにおけるデータ検索項目情報の自動定義システム

【課題】帳票を電子化して保存・管理し、閲覧者が端末から帳票を閲覧し、帳票中の表などのレイアウト上に規則をもった配置のデータや日付などの各種のデータ型のデータに対する検索を行うシステムにおいて、そのようなデータ検索のための項目定義を自動化する技術を提供することを目的とする。
【解決手段】帳票の元データとなる帳票データとその帳票中の各項目のデータ型および位置情報を含む書式データとを入力し、これらのデータから、汎用電子文書ファイルを生成する。該汎用電子文書ファイルおよび書式データを入力し、当該帳票のレイアウトを保持したまま検索を行えるように検索用帳票データを作成し帳票データベースに登録する。また、帳票の各項目のレイアウトおよびデータ型を意識した検索を可能にするため、書式データを解析し、検索対象となる項目の情報を抽出しデータ検索項目情報として検索情報データベースに登録する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、汎用電子フォーマットの帳票を保存・管理し、閲覧者端末から閲覧やデータ検索を行う電子帳票システムの技術に関するものである。
【背景技術】
【0002】
PDF(Portable Document Format)などの汎用電子文書フォーマットの普及にともない、国税関連帳簿などの帳票は法的に長期保管が必要な帳票も紙での保存ではなく電子データでの保存が認められるようになってきている。ただし、そのためには複数の要件を満たす必要があり、その中の1つに、帳票の表の中の複数の特定項目に対して日付などのデータ型を考慮した検索を行えるといった帳票のレイアウト構造を意識した検索によって目的のデータを見つけ出すことができること、という要件がある。
【0003】
最近では、汎用電子文書ファイルを取り込み、帳票の参照と帳票中のデータを利用可能とすることで、帳票の見た目を保持しながら、帳票中の項目の検索を行うことができる電子帳票システム製品も存在する。図12は、そのような従来の電子帳票システムの概要を表わすブロック構成図である。このシステムは、汎用電子文書ファイル1201の中のデータを格納するデータベース1202、全体の制御を行うデータ処理部1203を備えた電子帳票システム1204、および、閲覧者が検索項目の定義や検索条件などの設定を行う入力部1205と処理結果を表示する表示部1206とを備えた閲覧者端末1207から構成されている。
【0004】
図12のようなシステムによれば、レイアウト情報を持たない汎用電子文書ファイル1201を閲覧者端末1207で閲覧して、閲覧者が帳票レイアウトを意識しながら検索を行う項目を手動で定義することで、帳票データにレイアウト情報をマッピングでき、帳票中の項目のデータ型とレイアウト構造を意識した検索を行うことができる。
【0005】
本発明に関連する公知技術文献としては、文書画像のレイアウトを特定する技術として下記特許文献1および特許文献2が挙げられる。データ型を考慮した検索を行う技術として、下記特許文献3が挙げられる。
【特許文献1】特開平8−279019公報
【特許文献2】特開2003−187217公報
【特許文献3】特開2000−76256公報
【発明の開示】
【発明が解決しようとする課題】
【0006】
汎用的電子文書フォーマットの帳票は、閲覧用として一般的に広く使われている扱い易いものであるが、項目がどんなデータ型をしているかといった属性情報や、位置や範囲といった座標情報を持っていない。また、表形式が含まれる場合も、その中の行が検索対象外のヘッダ行であるのか、検索対象の明細行であるのかを判断する情報も持っていない。このため、汎用電子文書フォーマットの帳票に対して検索を行う場合、全文検索を行うことになり、帳票中の項目を指定しての検索を行うことはできない。
【0007】
項目に対する検索を行うためには、汎用電子文書フォーマットの帳票ファイルを予め保存管理する電子帳票システムに登録し、例えば上記特許文献3のように検索対象の項目の位置やデータ型を手作業で1つずつ定義する方法がある。
【0008】
しかし、この方法では、日付型データを認識することはできるが、実際のデータ型にはそれ以外にも数値型や文字型など多くのデータ型が存在し、項目を検索するためにはこれらのデータ型の全てを認識できるようにする必要がある。更に、これらの項目定義を手作業で行うためには、予め、帳票のデータ型やレイアウト構造について理解しておく必要があるが、帳票を見ただけで帳票設計者の意図を正確に把握することは困難である。また、人間の判断や手作業によりずれなどが発生し、検索の信頼性を損なわせる要因となっている。
【0009】
上記特許文献1や特許文献2のように、画像認識によりレイアウトフォーマットを検出する方法も考えられるが、文字データを保持している汎用電子文書フォーマットをわざわざ画像フォーマットにすることにより発生する手間や、画像フォーマットの文字認識の仕組みの実装や認識の精度を考慮する必要が出てきてしまい、遠回りのアプローチ方法になってしまう。
【0010】
本発明の目的は、帳票を電子化して保存・管理し、閲覧者が端末から帳票を閲覧し、帳票中の表などのレイアウト上に規則をもった配置のデータや日付などの各種のデータ型のデータに対する検索を行うシステムにおいて、そのようなデータ検索のための項目定義を自動化する技術を提供することにある。
【課題を解決するための手段】
【0011】
上記目的を達成するために、請求項1に係る発明は、電子帳票システムにおける帳票のデータ検索項目情報を自動で定義する自動定義システムであって、帳票の元データとなる帳票データと、その帳票中の各項目のデータ型および位置情報を含む書式データとを、入力する手段と、入力した帳票データおよび書式データから、帳票中の各項目のデータ型および位置情報を持たない汎用電子文書ファイルを生成する手段と、前記汎用電子文書ファイルおよび前記書式データを入力し、これらのデータから、当該帳票のレイアウトを保持したまま検索を行えるような形式である検索用帳票データを作成し帳票データベースに登録する手段と、前記帳票のレイアウトおよび前記帳票中の項目のデータ型を意識した検索を可能にするため、前記書式データを解析し、検索対象となる項目のデータ型および位置情報を抽出してデータ検索項目情報として検索情報データベースに登録する手段とを備えることを特徴とする。
【0012】
請求項2に係る発明は、請求項1において、閲覧者端末からの要求に応じて、前記帳票データベースに登録されている検索用帳票データを前記閲覧者端末に表示する手段と、前記検索用帳票データに対して、前記閲覧者端末から送信される前記帳票の各項目のレイアウトおよび各項目のデータ型を指定した検索条件に応じた検索処理を実行する検索処理手段と、前記検索処理の結果を前記閲覧者端末に返して表示させる手段とをさらに備えることを特徴とする。
【発明の効果】
【0013】
本発明の電子帳票システムにおけるデータ検索項目情報の自動定義システムによれば、電子データで保存・管理されている帳票に対し、表などのレイアウトの規則をもった配置のデータや日付、文字や数値などのデータ型に対する検索を行うための定義を自動化することができる。これにより、閲覧者が端末から帳票を閲覧し、帳票中の表などのレイアウト上に規則をもった配置のデータや日付などの各種のデータ型のデータに対し、項目のレイアウトやデータ型を意識した検索を行うことができるようになる。
【発明を実施するための最良の形態】
【0014】
以下、本発明を適用した電子帳票システムでのデータ検索のための項目定義を自動化する方法の一実施の形態について説明する。
【0015】
図1は、本発明の実施の形態の一例を示すシステム構成図である。同図のシステムは、帳票設計システム102と、帳票生成システム105と、電子帳票システム108と、閲覧者端末117とを備える。
【0016】
帳票データ101は、業務システムなどから出力される帳票の元データとなるデータである。帳票設計システム102は、帳票の書式を定義するための帳票データ作成部103を備える。ユーザは、帳票データ作成部103を用いて、データ項目の範囲や項目同士の関連などの帳票構造に関する設計情報を含む書式データ104を作成することができる。
【0017】
帳票生成システム105は、汎用電子文書ファイル107を生成するための帳票生成部106を備える。汎用電子文書ファイル107は、帳票の汎用的な電子フォーマットとしてデータ項目の範囲や項目同士の関連などの帳票構造に関する設計情報を持たない電子文書ファイルである。帳票生成定義データベース118には、帳票データ101と書式データ104と汎用電子文書ファイル107との対応関係を格納する。
【0018】
電子帳票システム108は、帳票登録部110と、検索情報マッピング部112と、帳票データ検索処理部113とを備える。帳票登録部110は、汎用電子文書ファイル107に対して、見た目(帳票のレイアウト)を保持したまま検索を行えるような形式の検索用帳票データを作成し帳票データベース109に登録する処理を行う。検索情報マッピング部112は、帳票のレイアウトや帳票中の項目のデータ型を意識した検索を可能にするために、書式データ104を解析し、必要な情報を検索情報データベース111に登録する処理を行う。帳票データ検索処理部113は、閲覧者端末117からの検索要求に応じて帳票の検索処理を行い、実行結果を閲覧者端末117に返す処理を行う。
【0019】
閲覧者端末117は、検索情報定義部114と、帳票データ検索条件設定部115と、表示部116とを備える。検索情報定義部114は、閲覧者が帳票のデータ項目ごとの検索を行うための検索対象のデータ範囲などの定義や編集を行う。帳票データ検索条件設定部115は、検索条件を設定し検索実行する処理を行う。表示部116は、帳票の画面表示や検索設定のためのダイアログ画面の表示および検索結果の画面の表示を行う。
【0020】
図2は、汎用電子文書ファイル107の帳票の例である。汎用電子文書ファイル107は、閲覧用として一般的に広く使われているフォーマットのファイルとし、各項目のデータ型などの属性情報や、各項目の位置や範囲などの座標情報を持たないファイルである。この帳票を見ただけでは、どのデータが固定であるか可変であるかを正確に判断することは困難である。実際には、この汎用電子文書ファイル107を生成するための帳票の設計情報が含まれる書式データ104が存在する。この書式データ104は、帳票設計システム102の帳票データ作成部103によって作成される。
【0021】
図3は、図2の帳票の場合に主な情報だけピックアップした書式データ104のフォーマット例を示す。この書式データ104は、データの種類を表わすデータ種別301と、帳票中で一意に定義される項目名302と、データごとのデータ型や桁数、位置情報やフォント情報といった書式情報であるデータ属性303とから構成される。304はデータ種別が「固定文字」の項目の書式のデータ、305はデータ種別が「フィールド」の項目の書式のデータ、306はデータ種別が「表形式」の項目の書式のデータを示す。固定文字の書式データ304は、「勘定元帳」などの固定の文字の書式を定義する。フィールドの書式データ305は、「会社名」などの可変の個別データ項目の書式を定義する。表形式の書式データ306は、ある範囲で同じフォーマットのレコード行が繰り返される表形式の書式を定義する。
【0022】
表形式の書式データ306は、さらに下位の書式データ307を有する。この書式データ307は、その表内にあるデータの、データ種別、項目名、およびデータ属性を定義するものである。表形式の書式データ307の中で、データ種別が「固定文字」のデータは、その表の中で見出し等に相当する固定の文字を定義するデータである。データ種別が「レコード」のデータは、繰り返し表示される可変の明細行の書式を定義するデータである。
【0023】
各「レコード」は、さらに下位の書式データであるレコードフィールド情報308を有する。レコードフィールド情報308は、そのレコードの明細行の各フィールドの、データ種別、項目名、およびデータ属性を定義するものである。
【0024】
図3の書式データ104により、図2の汎用電子文書ファイル107において、各ページ共通の固定データが番号201,202に示す部分であり、可変の個別データ項目が番号203,204,205に示す部分であることが分かる。また、表形式206におけるレコード行の繰返し位置範囲が分かり、さらにその表形式206の中で、表の見出し固定データ項目が番号207に示す部分であり、可変の明細行のデータ項目が番号208に示す部分であることが分かる。
【0025】
図4は、帳票の元となる帳票データ101のフォーマット例を示す。帳票データ101は、図3の書式データとともに、図2の汎用電子文書ファイル107の帳票を生成するために必要となるデータである。本実施形態において、帳票データ101は、個別データ項目404のデータと、表形式中の可変の明細行411のデータとを有し、これらの各データはそれぞれ項目名とそれに対応する実際のデータとからなる。また、この帳票の例では、個別データ項目404は、会社名401、ページ数402、および帳票日付403からなる。これらの個別データ項目404の各データは、項目名で図3の書式データ104の可変の個別データ項目である各フィールド305と対応付けられる。また、可変の明細行411は、年月日405、伝票406、相手科目407、借方408、貸方409、および残高410からなる。これらの可変の明細行411の各データは、項目名で図3の書式データ104の繰り返し表示される可変の明細行のレコードフィールド情報308中の各フィールドと対応付けられる。これにより、図3の書式データ104を参照することで、図4の帳票データ101中の各データをセットするフィールドを認識できる。
【0026】
図5は、帳票生成定義データベース118に格納される情報を表わす。帳票生成定義データベース118には、フルパスで、帳票データ101のファイル名501と、それに対応する書式データ104のファイル名502と、それらから生成した汎用電子文書ファイル107のファイル名503とが格納される。帳票生成システム105の帳票生成部106は、帳票データ101と書式データ104から汎用電子文書ファイル107を生成したとき、それらの各ファイルの位置と対応関係を示すためにこれらのデータ501〜503を設定する。
【0027】
図6は、電子帳票システム108により汎用電子文書ファイル107の検索を行うための定義を自動化する処理の概要を示すフローチャートである。電子帳票システム108で本処理を実行して汎用電子文書ファイル107を帳票データベース109や検索情報データベース111に登録することにより、当該汎用電子文書ファイル107に対して、表などのレイアウトの規則をもった配置のデータや、日付、文字、および数値などのデータ型に対する検索を行うための定義を自動的に行うことができる。
【0028】
まず、読み込む汎用電子文書ファイル107のパスを取得する(ステップ601)。次に、帳票生成定義データベース118から、その汎用電子文書ファイル107に対応する書式データ104のパスを取得する(ステップ602)。汎用電子文書ファイル107を読み込み、データ情報と書式情報に変換する(ステップ603)。このデータ情報と書式情報は、後述するように、閲覧者端末117からの検索を可能にするための情報である。データ情報と書式情報については、図7で詳しく説明する。次に、変換したデータ情報と書式情報(これらをまとめて検索用帳票データと呼ぶ)を帳票データベース109に登録する(ステップ604)。書式データ104の内容を読み込み、検索対象の項目の書式情報を抽出する(ステップ605)。最後に、前記抽出した検索対象の項目の書式情報をデータ検索項目情報として検索情報データベース111に登録する(ステップ606)。検索情報データベース111に登録する情報については、図8で詳しく説明する。
【0029】
なお、上記ステップ601〜604は主として帳票登録部110により実行され、ステップ605,606は検索情報マッピング部112により実行されるものである。
【0030】
図7は、帳票データベース109に格納された検索用帳票データを表わしている。検索用帳票データは、図2の汎用電子文書ファイル107を元に作成された、文字情報とその位置情報を持ったデータ情報701、および、罫線などの書式情報702から構成されている。
【0031】
図8は、検索情報データベース111に格納されたデータ検索項目情報を表わしている。データ検索項目情報には、図3の書式データ104から、検索に必要なデータのみを抽出して格納する。具体的には、検索対象の可変項目であるフィールド情報801に加え、表を構成する表形式情報802と、レコード情報803と、レコードフィールド情報804が格納される。
【0032】
ユーザは、ネットワークを介して電子帳票システム108に接続されている閲覧者端末117を用いて、帳票データベース109に登録されている検索用帳票データを表示させることができる。図7で説明したように、帳票データベース109に登録された検索用帳票データはデータ情報701と書式情報702を有するので、閲覧者端末117で表示される帳票の見た目は、作成時の見た目と同じである。さらに、上述した図8のデータ検索項目情報を自動で生成してあるので、レイアウト構造を意識した検索やデータ型を意識した検索を行うことができる。
【0033】
図9は、閲覧者端末117における帳票の画面表示の例を示す。特に、図8のデータ検索項目情報で定義された検索対象のデータ項目の中の特定の項目を選択している状態の表示例を示す。
【0034】
検索対象の項目名や検索範囲は図6の処理により自動で定義されるため、検索できる範囲を確認したい場合がある。その場合、ユーザが画面上に表示された帳票の任意の項目名を選択すると、その項目名の項目が検索できる範囲内であった場合は、その項目の部分の色が変わって表示される。その処理は、検索情報定義部114が行う。すなわち、検索情報定義部114は、ユーザが選択した項目名が図8の情報の中にあれば、検索可能な範囲の項目として、その項目の部分の色を変えて表示する。図9では、会社名が選択され、この項目は検索可能な範囲内であるので、901のように色を変えて表示が為されている。同様に、例えば図9の画面上で「年月日」の項目名を選択すると、図8の情報から「年月日」の項目が検索可能な範囲内であることが分かるので、「年月日」の列が色を変えて表示される。このようにして、検索できる範囲を確認することができる。
【0035】
また、検索情報定義部114により、図9の画面上で、定義済みの項目名や検索範囲を手動で変更することも可能である。更に、検索項目を手動で新規登録することも可能である。例えば、現在選択されて色が変わって表示されている項目または検索範囲を再度選択することによって、項目名等をキー入力可能な状態にする。また、図9に編集用ボタンを別途設け、編集用ボタンを押すことによって、選択された項目名等を手動編集可能な状態にするようにしてもよい。
【0036】
図10は、閲覧者端末117の画面上にて帳票データ検索条件設定部115で検索条件を設定して検索を行う例である。検索画面の種類としては、個別項目での検索を行う個別項目検索画面1001と、表形式の中のレコードの中の項目に対して検索を行うレコード項目検索画面1002などがある。所定の操作により、何れかの検索画面を表示させて検索を行う。
【0037】
個別項目検索画面1001による検索を行う場合は、当該画面内の検索対象項目1003a、検索キー1004a、検索キー1004aとの比較条件1005aを設定し、検索実行ボタン1006aを押下する。レコード項目検索画面1002による検索を行う場合は、まず、検索対象表1007と、検索対象レコード1008を選択する。ここでは、1つの表に別書式の2種類以上のレコードが含まれる場合があるものとする。次に、検索条件が1つである場合は、その検索条件として、検索対象項目1003b、検索キー1004b、検索キー1004bとの比較条件1005bを設定し、検索実行ボタン1006bを押下する。2つ以上の検索条件がある場合は、1つ目の検索条件は上記の通りに設定し、2つ目以降の検索条件は結合条件1009を付けて同様に設定し、検索実行ボタン1006bを押下する。結合条件1009は、当該行の検索条件とその上の行の検索条件との結合条件を表す。
【0038】
なお、検索対象項目1003aは、図8のデータ検索項目情報から抽出した項目名をリストボックス形式でユーザに提示し、その中から選択させることで設定できる。検索キー1004aは、入力可能な検索キー1010のように入力する。すなわち、検索対象項目1003aに設定された項目のデータ型を図8のデータ検索項目情報から取得し、そのデータ型に応じた任意の値が入力できるようにしている(逆に、データ型に応じた値以外は設定できない)。比較条件1005aは、選択可能な比較条件1011に示されているように、データ型に応じた選択肢をリストボックス形式でユーザに提示し、その中から選択させることで設定できる。例えば検索対象項目1003aに「年月日」を指定すれば、データ型が「日付型」に限定され、「等しい、以降、以前」のみが指定可能である。これにより、帳票内の検索対象データ型のデータから検索が行える。
【0039】
検索対象表1007は、図8のデータ検索項目情報のうちデータ種別が表形式である項目名を抽出し、リストボックス形式でユーザに提示し、その中から選択させることで設定できる。検索対象レコード1008は、検索対象表1007の表形式情報802の下位のレコード情報803から項目名を抽出し、リストボックス形式でユーザに提示し、その中から選択させることで設定できる。結合条件1009は、選択可能な結合条件1012に示されているように、ANDまたはORの何れかを選択できる。検索対象項目1003bは、検索対象レコード1008の下位のレコードフィールド情報804から項目名を抽出し、リストボックス形式でユーザに提示し、その中から選択させることで設定できる。検索キー1004bおよび比較条件1005bは、上述した1010および1011のように設定する。
【0040】
図11は、実際に図10のレコード検索1002の検索条件で検索を行ったときの画面の表示例である。検索対象の表1の中で、年月日が2008年1月1日で、かつ、伝票が0002であるレコードが検索条件に当てはまるものであり、検索結果レコード1101のように着色されて表示されている。
【0041】
以上、好ましい実施の形態について説明したが、本発明は前記実施の形態に限定されるものではなく、本発明の要旨を逸脱することのない範囲内において適宜の変更が可能なものである。例えば、書式データは汎用ファイルの種類や作成ツールの種類によってもフォーマットが異なるので、合わせて定義方法を変更しても構わない。また、検索条件の設定や項目情報の定義・変更にGUIを用いるとしたが他のインタフェースであっても構わない。
【図面の簡単な説明】
【0042】
【図1】本発明の一実施の形態例を示すシステム構成図である。
【図2】汎用電子文書データの一例を示す図である。
【図3】書式データの内部構造の一例を示す図である。
【図4】帳票データの内部構造の一例を示す図である。
【図5】帳票生成定義データベースに格納されているデータの構成図である。
【図6】帳票検索項目定義の自動登録処理の概要を示すフローチャートである。
【図7】帳票データベースに格納されているデータの構成図である。
【図8】検索情報データベースに格納されているデータの構成図である。
【図9】画面上に表示される帳票の検索項目選択時の表示の例である。
【図10】画面上で検索条件を設定する操作の例である。
【図11】画面上に表示される帳票の検索結果の表示の例である。
【図12】従来の電子帳票システムの概略構成図である。
【符号の説明】
【0043】
101…帳票データ、102…帳票設計システム、103…帳票データ作成部、104…書式データ、105…帳票生成システム、106…帳票生成部、107…汎用電子文書ファイル、108…電子帳票システム、109…帳票データベース、110…帳票登録部、111…検索情報データベース、112…検索情報マッピング部、113…帳票データ検索処理部、114…検索情報定義部、115…帳票データ検索条件設定部、116…表示部、117…閲覧者端末、118…帳票生成定義データベース。

【特許請求の範囲】
【請求項1】
電子帳票システムにおける帳票のデータ検索項目情報を自動で定義する自動定義システムであって、
帳票の元データとなる帳票データと、その帳票中の各項目のデータ型および位置情報を含む書式データとを、入力する手段と、
入力した帳票データおよび書式データから、帳票中の各項目のデータ型および位置情報を持たない汎用電子文書ファイルを生成する手段と、
前記汎用電子文書ファイルおよび前記書式データを入力し、これらのデータから、当該帳票のレイアウトを保持したまま検索を行えるような形式である検索用帳票データを作成し帳票データベースに登録する手段と、
前記帳票のレイアウトおよび前記帳票中の項目のデータ型を意識した検索を可能にするため、前記書式データを解析し、検索対象となる項目のデータ型および位置情報を抽出してデータ検索項目情報として検索情報データベースに登録する手段と
を備えることを特徴とするデータ検索項目情報の自動定義システム。
【請求項2】
請求項1に記載の電子帳票システムにおけるデータ検索項目情報の自動定義システムにおいて、
閲覧者端末からの要求に応じて、前記帳票データベースに登録されている検索用帳票データを前記閲覧者端末に表示する手段と、
前記検索用帳票データに対して、前記閲覧者端末から送信される前記帳票の各項目のレイアウトおよび各項目のデータ型を指定した検索条件に応じた検索処理を実行する検索処理手段と、
前記検索処理の結果を前記閲覧者端末に返して表示させる手段と
をさらに備えることを特徴とするデータ検索項目情報の自動定義システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公開番号】特開2010−26750(P2010−26750A)
【公開日】平成22年2月4日(2010.2.4)
【国際特許分類】
【出願番号】特願2008−186747(P2008−186747)
【出願日】平成20年7月18日(2008.7.18)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【Fターム(参考)】