データ管理システムおよび方法並びにプログラム
【課題】データの登録時に指定した場所が果たして正しい登録場所かを判定し、あるいはデータの登録時にデータ内容から適切な登録場所を提示させる。
【解決手段】データ管理システムにおいて、文書データが登録されるファイル格納部23と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域22と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部12と、前記テキスト検索部から出力される検索情報を用いて前記文書データの格納場所またはその候補を決定する登録先判定部13とを具え、前記登録先判定部13は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する保存先を抽出することにより前記文書データの登録場所またはその候補を決定する。
【解決手段】データ管理システムにおいて、文書データが登録されるファイル格納部23と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域22と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部12と、前記テキスト検索部から出力される検索情報を用いて前記文書データの格納場所またはその候補を決定する登録先判定部13とを具え、前記登録先判定部13は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する保存先を抽出することにより前記文書データの登録場所またはその候補を決定する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書データを保存するデータ管理システムに関し、特に、データ内容に基づいて登録場所の妥当性を判断したり適切な登録場所を提案したりするデータ管理システムおよび方法並びにプログラムに関する。
【背景技術】
【0002】
今日、会計事務所の多くは財務処理専門のコンピュータシステムを導入して業務を行っており、このようなシステムの仕様に基づいて顧客毎に膨大な数のデータを管理している。例えば、ある財務システムでは、記憶領域に図3に示すような顧客毎のフォルダ(ディレクトリ)階層が構築される。図3に示すように、顧客名に対応するフォルダの下に財務システムの業務ユニット名である会計・税務・一般の3つの下層フォルダが作成され、これらのフォルダ内に当該顧客の業務毎に関連して作成された個々のデータファイルが登録される。なお、このシステムでは新規顧客を登録すると自動的に会計・税務・一般の3つのフォルダが作成されるが、会計事務所が顧客からどの業務を請け負うかは顧客との取り決めにより、請け負わない業務に関するフォルダは使用されない。これが図3において斜線で示されるフォルダである。
【0003】
電子ファイリングに関する従来技術として、画像をスキャナで読み込み、OCR処理を行って得たテキストデータを検索タイトルとしてイメージデータと対応づけて記憶するシステムが提案されている(例えば、特許文献1、2)。また、本願出願人は、ファイル内に含まれる顧客情報と、コピー先または移動先フォルダの管理情報に含まれる顧客情報とを照合することにより、ファイルをコピーまたは移動すべきフォルダと異なるフォルダを選択するという人為的な操作ミスを防ぐための技術を提案している(例えば、特許文献3)。
【特許文献1】特開平10−162016号公報
【特許文献2】特開平8−137971号公報
【特許文献3】特開2007−200283号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1、2の技術では、ファイルの保存場所はオペレータが指定するため、本来登録すべき保存場所と異なる場所が間違って指定され、オペレータが気付かずに登録してしまう可能性があった。また、例えば特許文献1の技術において画像ファイルに関連づけられる検索タイトルは、画像ファイルから抽出したテキストデータを最大許容量まで取り込んで残りを切り捨てたものに過ぎず、抽出情報の取捨選択が行われないためそのファイルがどのような業務と関連するかが必ずしも分からなかった。この場合もオペレータが手動で登録先を決定することとなるが、その分類ポリシーはオペレータの判断に委ねられるため、異なるオペレータによる判断基準の相違や熟練度による判断基準の変化などで、ファイルの関連づけの一貫性が保たれない可能性があった。
【0005】
また、上記特許文献3のシステムは、顧客情報が整合しないファイルのコピーや移動を防止しうるものであるが、例えば図3に示すシステムのように顧客毎に複数のフォルダ階層が構築されるような場合には利用できない。
【0006】
したがって、データの登録時に指定した場所が果たして正しい登録場所かを判定し、あるいはデータの登録時にデータ内容からシステム側が適切な登録場所を提示するようなデータ管理システム、方法、プログラムが求められていた。
【課題を解決するための手段】
【0007】
本発明にかかるデータ管理システムは、上記課題を解決するためになされたものであり、文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部と、前記テキスト検索部から出力される検索情報を用いて前記文書データの登録場所またはその候補を決定する登録先判定部とを具え、前記登録先判定部は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する登録先を抽出することにより前記文書データの登録場所またはその候補を決定することを最も主要な特徴とする。
【0008】
このデータ管理システムは、さらに、前記システムのオペレータから前記文書ファイルの登録場所の指定を受け付ける入力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所と、前記入力手段で指定された文書ファイルの登録場所とを照合して、前記指定された登録場所が妥当か否かを判定することが有効である。
【0009】
さらに、前記コンピュータシステムのオペレータに前記文書データの登録場所の候補を提示する出力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所を前記オペレータに提示して、当該オペレータが選択した登録先に前記文書データを登録することが有効である。
【0010】
また、前記テーブル格納領域に、前記記憶領域における登録場所の情報に関するテーブルが格納されているとともに、前記登録先判定部がさらに、前記登録場所の情報に関するテーブルを参照して前記文書データの登録場所またはその候補として決定した登録場所が利用可能か否かを確認することが有効である。
【0011】
さらに、光学式読取(OCR)手段を具え、画像データにOCR処理を行ってテキスト情報を生成し、前記画像データの登録場所またはその候補を決定することが有効である。
【0012】
実施例によっては、前記文書データが登録される記憶領域および前記テーブル格納領域が通信ネットワークに接続された文書サーバ内にあるとともに、前記テキスト検索部および登録先判定部が前記ネットワークに接続されたクライアント端末内にあってもよい。
【発明の効果】
【0013】
本発明の文書管理システムは、予め文書データの登録場所に関するキーワードが登録された1以上のテーブルを参照して文書データのテキスト情報を検索し、抽出されるキーワードから当該文書データの登録場所またはその候補を自動的に決定するものであるため、間違った場所に文書データを登録してしまうといった事態が防止される。また、1以上のテーブルに登録されたキーワードに基づいて機械的に登録作業を決定するため、オペレータが恣意的に登録場所を決定する運用に比べ、文書内容に対する登録先の関係の一貫性を保つことができる。
【0014】
また、システムのオペレータにより登録場所を指定されている場合、この指定先と決定した登録場所を照合して妥当性を判断するため、オペレータが間違った登録場所を指定していた場合でも、この間違った場所に文書データが登録されるのを未然に防ぐことができる。
【0015】
また、登録先判定部が決定した登録場所の候補をシステムのオペレータに提示することにより、登録場所が指定されていない場合や間違った場所が指定されていた場合に、オペレータを正しい登録場所に導くことができる。データ保管場所の一貫性が保たれるとともに、オペレータが自分で判断してデータの登録場所を指定する労力を軽減することができる。さらに、自動的にデータを登録すべき場所を提示してくれるため、特に社内LANなど比較的複雑化したシステムにおいてシステムや操作に知識のない者でも容易に正しい場所にデータを登録することができる。
【0016】
また、システムが登録場所の情報に関するテーブルを具え、決定した登録場所が利用可能かを確認することにより、例えば財務処理専門のコンピュータシステムにおいて顧客と取り決めのない、すなわち利用すべきでない業務フォルダにデータが登録されるのを防止することができる。
【0017】
また、OCR処理を行いテキストデータを取得して検索をかけることにより、画像形式で取り込まれるデータに対しても自動的に登録先を決定することができる。
【0018】
また、通信ネットワークを介してクライアント端末から文書登録サーバに文書データを登録するように構成することにより、例えば社内LANなどで接続された複数の端末で扱う多数の文書データを一元的かつ一貫性を持たせて管理することができる。
【発明を実施するための最良の形態】
【0019】
本発明を実施するための最良の形態について、図面を参照しながら以下に詳細に説明する。図1は、本発明の一実施例にかかるデータ管理システムの構成例を示す図である。前提として、本実施例のコンピュータシステムは例えば会計事務所で利用されるものであり、財務処理プログラム(図示せず)が実装されているものとする。本実施例にかかるシステム、方法およびプログラムは、このような財務処理プログラムの運用中に作成または取り込まれる文書データについてオペレータから指定される登録先の妥当性を検証し、あるいは適切な登録先を提示して、データ保管場所の一貫性を保たんとするものである。
【0020】
本実施例のシステムは所謂スタンドアロン型であり、一般的なコンピュータシステムに本発明にかかるデータ管理プログラムをインストールして構成することができる。図1に示すように、このシステムは、制御部10と、記憶部20と、表示部30と、入力部40と、通信部50とを具えている。制御部10は中央処理装置を含み、本発明にかかるデータ管理プログラムを実行して各種処理を行う。記憶部20は、文書データが登録されるHDDといった大容量記録装置の他に、RAM、ROMなどの各種メモリも含む概念であり、さらに外付けハードディスクなどの外部記憶装置やDVD−RWなどの可搬型記憶媒体であってもよい。また、後述する実施例(図13および図14)のように、ネットワークを介して接続された他のコンピュータ端末内に存在してもよい。
【0021】
表示部30は、CRTまたはLCD(液晶ディスプレイ)などで構成され、このコンピュータシステムのオペレータに文書ファイルや各種メッセージを表示する。入力部40は、例えばキーボード41やマウス42であり、オペレータが各種情報を入力するのに用いられる。また、入力部40は登録対象となる文書データを取り込むスキャナ(図示せず)を具えてもよい。通信部50は、ネットワーク(インターネットやWAN、LAN)に対しデータの送受信を行い、必要な通信プロトコルを実装している。ただし、スタンドアロン型の本実施例では通信部50は必ずしも必要ではない。
【0022】
本発明にかかるファイル管理プログラムは、例えばシステムが具えるCD−ROMドライブ(図示せず)にセットされたCD−ROMから、記憶部20にインストールされる。そして、プログラムの実行時に記憶部20から読み出されて所定の場所に展開される。このようにして、制御部10は記憶部20に格納されたプログラムに従って、後述する処理を実行する。なお、ファイル管理プログラムはCD−ROMからではなく、他の磁気ディスク、磁気テープ、光ディスクなどの記録媒体からこのコンピュータシステムにインストールされてもよい。また、ネットワークを通じて電子メールやインターネットダウンロードなどの伝送媒体により提供されてもよい。
【0023】
図2は、図1に示すコンピュータシステムの制御部10と記憶部20の構成をより詳細に示す図である。本図に示すように、制御部10は、選択および処理指示部11と、テキスト検索部12と、登録先判定部13とを具えている。これらの要素は本発明のデータ管理プログラムの個々のプログラムモジュールであり、中央処理装置や一時メモリなどのハードウェアとの協働により実現される。選択および処理指示部11は、入力部40からオペレータによる文書データの選択やデータ登録処理の指示を受けて実行する。テキスト検索部12は、所定のテーブルまたは辞書(記憶部20のテーブル格納領域22)に基づいて、保存される文書データのテキスト情報を検索し、キーワードを抽出する。登録先判定部13は、抽出されたキーワードに基づいてテーブルまたは辞書を参照し、当該文書データの登録先またはその候補を決定する。なお、図2では制御部10の要素として特に重要なもののみを示すが、本発明は後述する処理に必要な他の様々なプログラムモジュールまたは手段を具えるものとする。
【0024】
記憶部20は、未分類すなわちこれから登録場所が決定される文書データが一時的に格納される文書データ群一次保存領域21と、文書データの登録場所の決定に必要な各種テーブルまたは辞書が登録されるテーブル格納領域22と、最終的に文書データが保存されるファイル格納部23とを具えている。
【0025】
ここで、本実施例におけるファイル格納部23の構造を図3に示す。上述したように、本実施例のコンピュータシステムは財務処理システムとして構成され、その仕様によって本図に示すようなフォルダ(ディレクトリ)階層が構築されている。図3に示すように、本実施例では顧問先ごとに上位フォルダ群201が作成され、その下の階層に会計、税務、および一般といった業務ごとに3つずつのフォルダ群202が作成され、これらのフォルダ内に当該顧客の業務毎に関連する個々のデータファイルが登録される。なお、この財務処理プログラムでは新規顧客を登録すると自動的に会計・税務・一般の3つのフォルダが作成されるが、会計事務所が顧客からどの業務を請け負うかは顧客との取り決めにより、請け負わない業務に関するフォルダは使用されない。このフォルダが図3において概念的に斜線で示されている。なお、フォルダ(ディレクトリ)構造は本実施例に限るものではなく、例えば会計年度やグループ会社などで細分され、より多くの階層をもつ構造としてもよい。
【0026】
図4乃至図6は、本実施例におけるテーブル格納領域22に登録されたテーブルおよび辞書の内容を示す図である。これらのテーブルおよび辞書は、テキスト検索部12および登録先判断部13により利用される。図4(a)は、図3に示す上位フォルダ群201と会社名とを関連づけるテーブル1であり、顧客ごとに一意に設定される管理番号と、上位フォルダ名と、会社名とが関連づけられている。一方、図4(b)に示すテーブル2は、個々の文書データで用いられる可能性のある会社の略称や別名などをテーブル1の上位フォルダ名と関連づけるテーブルであり、テーブル1にて設定された管理番号と、略称または別名リストとが関連づけられている。例えば、テーブル1で「ABC工業」との上位フォルダ名で管理される「株式会社ABC工業」に設定された管理番号1に、「株式会社ABC工業」、「(株)ABC」、「エービーシー東京」などの考えられる略称または別名が関連づけられる。同様に、管理番号2で管理される「DEF商事株式会社」には、「デー・イー・エフ」や「DEF商事(株)」などの略称または別名が関連づけられている。このテーブル2により、文書ファイル内に正式な社名(テーブル1記載の社名)が用いられていない場合でも、テーブル2にリストアップされた略称や別名があればその会社に関連する文書であると関連付けることが可能となる。
【0027】
次に、図5に示すテーブル3は、ファイル格納部23で文書ファイルの登録先として利用可能なフォルダを管理するテーブルであり、顧客の管理番号ごとに、会計、税務、一般の3つの下層フォルダ202のどのフォルダが利用可能かが関連づけられている。ここで、フォルダが利用可能すなわち顧客からその業務を請け負っている場合には「1」、使用しない場合には「0」が登録される。 本実施例では図3に示すように「DEF商事」の一般フォルダと、「GHI産業」の会計フォルダが使用されておらず、これに対応してテーブル3では管理番号2(DEF商事に相当)の「一般」欄と管理番号3(GHI産業に相当)の「会計」欄に「0」が登録され、それ以外の欄に「1」が登録される。
【0028】
これらのテーブル1乃至3の情報は、コンピュータシステムで動作する財務処理プログラムで新規顧客を登録するときに新規レコードとして作成されるものである。すなわち、財務処理プログラム上でオペレータが新規顧客を登録すると、図3に示すフォルダ構造に3つの下位フォルダ(会計・税務・一般フォルダ)を有する1つの上位フォルダ(会社名フォルダ)が自動的に作成されるとともに、テーブル1に管理番号が設定され、オペレータが入力した顧客の会社名を用いて新規顧客の会社名とフォルダ名が登録される。また、オペレータの指定により、あるいは入力された会社名から自動的に、その会社の略称または別名がテーブル2に登録される。ここで、自動的に略称または別名を登録するには、オペレータが漢字変換する前の入力内容から読み方を抽出したり、システムがアルファベット各文字とその読み方の片仮名表記の対照表を予め具えており、例えば「ABC」を含む会社名から「エー・ビー・シー」なる別名を抽出するようにプログラミングすることが考えられる。さらに、新規顧客の登録時にオペレータによって指定される請負業務の情報から、テーブル3の情報が登録される。これらの情報は予めテーブル1乃至3に登録されるものであるが、その処理は財務処理プログラムの動作であって、本発明のデータ管理プログラムの動作とは直接的に関連せず、また当業者であれば容易に理解できるため、これ以上の詳細な説明は本明細書では省略する。
【0029】
図6(a)および(b)は、文書データに含まれるキーワードから当該文書データがどの業務に関連するかを導き出すための辞書の一例を示す図である。図6(a)に示す辞書1は、本実施例のシステムで用いる業務名(会計・税務・一般)と、各業務に関連する文書カテゴリ名が関連づけられている。また、図6(b)の辞書2では、辞書1に登録された文書カテゴリに関連する複数のキーワードが登録されている。また、これは必須ではないが、各キーワードには重要度に応じた重み付けの数値が設定されている。これらの辞書1、2は、本発明にかかるデータ管理システム、方法、およびプログラムが適用されるコンピュータシステムの使用目的に応じて、本発明にかかるシステムまたはプログラムの出荷時、あるいはシステムの運用開始時に予め登録されるものとする。本実施例では会計事務所用のコンピュータシステムを想定しているが、他の業種で用いられるテーブルや辞書は他の構成となることは明らかである。
【0030】
このように構成されたデータ管理システムの動作を、図7以降を用いて詳細に説明する。図7は、本発明にかかるデータ管理方法の実施例を説明するためのフローチャートである。本図は、対象とする文書データの登録先がオペレータに指定されている場合の動作である。ここで、保存対象となる文書データは、図1の記憶部20の文書データ群格納領域21に一時的に格納されている。この文書データは、テキストデータを含んだ電子ファイルのことを指し、例えばワープロや表計算ソフトで作成されたファイルでもよいし、本システムで動作する財務処理プログラムで直前に作成されたものでもよい、また、予め財務処理プログラムや他のソフトウェアで作成され文書データ群一時格納領域21にプールされたもの、メール添付やインターネットダウンロードやLAN内の他の端末からネットワークを介して受け取ったものであってもよい。さらに、このシステムに接続されたスキャナ等の文書読取装置(図示せず)から取得され、OCR処理によりテキスト情報が付された画像データであってもよい。
【0031】
本実施例では、最初にシステムのオペレータにより文書データの指定と登録場所の選択を受け付ける(ステップA1)。図8は、文書データ選択時に表示部30からオペレータに提示される画面例である。本図に示すように、一時格納領域21に登録された文書データ群が表示部30にリスト提示され、オペレータが入力部40を操作していずれか1以上のファイルを選択できるようになっている。このリストには、ファイル名、形式、作成日付の情報が提示される。オペレータは対象とするファイルを例えばマウスでクリックすることにより反転表示させ、下にある確定ボタンを押下する。
【0032】
次に図9に示すような登録先選択画面が表示部30に提示され、同様にオペレータがファイルの登録場所を選択して確定ボタンを押下する。制御部10の選択および処理指示部11がこの入力を受け、文書データ群から該当する文書ファイルを抽出するとともにテキスト検索部12に処理を受け渡す。なお、本実施例では、オペレータは図3に示す会社毎の上位フォルダ201のみを指定し、その下の業務フォルダの指定は行わない。一方、システム側は文書内容に基づいて適切な会社名が指定されているかのチェックを行った上で、文書内容からどの業務フォルダに納まるべきかを判断し、自動的にファイルがそのフォルダに登録されるよう構成される。ただし、ステップA1でオペレータが2またはそれ以上の階層のパスを指定し、システム側がこれをすべてチェックする構成としてもよい。
【0033】
次に、制御部10のテキスト検索部12が、図4に示すテーブル1および2に登録された会社名およびその略称、別名をキーとして、文書ファイルのテキスト検索を行う(ステップA2)。これにより、文書ファイル内にいずれかの会社名または略称や別名が記載されている場合にそれが抽出される。具体的には、テキスト検索部12は、テーブル1の会社名およびテーブル2の略称または別名リストのすべてについて検索を行い、ヒットした会社名、略称または別名の管理番号を抽出し、検索結果を登録先判定部13に出力する。登録先判定部13は、ステップA1で選択された会社が文書ファイルの検索結果に含まれるかを判定する(ステップA3)。具体的には、ヒットした会社名等の管理番号がオペレータに選択された会社の管理番号と一致するか否かを比較する。1つの文書ファイル内に複数の会社名が検出された場合、本実施例では、検出された会社名のいずれか1つが選択された会社名と一致すればステップA3の判断はYESとする。ただし、別の実施例では、例えば文書ファイル内に最も多く出現する会社名のみを比較するようにしてもよい。ステップA3で選択された会社名が含まれればステップA5へ進み、文書ファイル内にオペレータに指定された会社名が含まれない場合はステップA4へと進む。
【0034】
文書ファイル内に指定された会社名がない場合、選択された登録先以外の会社名が含まれているかを判断する(ステップA4)。もしあれば、後述する図10のフローチャートへと移行する。なければ、そのままステップA5へ進む。
【0035】
ステップA5では、再びテキスト検索部12が辞書2のキーワードについてテキスト検索を行い、その結果により登録先判定部13が文書カテゴリ名を決定する(ステップA5)。ここで、文書カテゴリ名の決定方法は幾つか考えられるが、例えば最初にヒットしたキーワードに対応する文書カテゴリ名を採用する方法、ヒットした回数が最も多い文書カテゴリ名を採用する方法、図6(b)に示す辞書2に示すようにキーワード毎に重み付け情報を付加して、各キーワードのヒット回数に重み付け数値を乗じた値を文書カテゴリ名ごとに加算し、最も大きい値となった文書カテゴリ名を採用する方法等が考えられる。
【0036】
次に、登録先判定部13は図6(a)の辞書1を参照し、決定した文書カテゴリ名に対応する業務名を抽出する(ステップA6)。ここで抽出される業務名に対応する業務フォルダが、文書ファイルを登録すべきフォルダとして決定される。さらに、登録先判定部13は図5のテーブル3を参照して、該当する会社の業務フォルダが利用可能かを確認する(ステップA7)。利用可能であれば、文書ファイルをオペレータの選択した会社名のフォルダ内の該当する業務フォルダに関連づけて、ファイル格納部23に格納する(ステップA8)。本実施例では、このとき辞書2で抽出された文書カテゴリ名をファイル名またはその一部として採用し、辞書1で決定された業務フォルダに登録する。一方、決定された業務フォルダが利用可能でなければ、オペレータに選択された登録先に登録できないため、後述する登録先候補の提示処理へと進む(B:図10ステップB8へ)。別の実施例では、図11に示すように登録先の再選択を促す画面を表示して、この入力を受けて再びステップA1から繰り返すようにしてもよい。
【0037】
次に、図10のフローチャートを用いて、文書データの登録先が予めオペレータによって選択されていない場合の動作例を説明する。本実施例の方法は、予め登録先が指定されていない文書データについて、そのテキスト内容から登録先の候補を抽出してオペレータに選択させるものである。まず、選択および処理指示部11が、文書データ群一時格納領域21に登録されている文書データ群をオペレータに提示して、登録対象となる文書データの選択を促す(ステップB1)。この処理は図8の画面をオペレータに提示して行われる。ファイルの指定を受けたら、テキスト検索部12が図6(b)の辞書2のキーワードについて文書データのテキスト検索を行い、登録先判定部13がヒットしたキーワードから文書カテゴリ名を決定する(ステップB2)。これは図7のステップA5と同じであり、最初にヒットしたキーワードが属するカテゴリ名を採用したり、キーワード毎に重み付けを付与しておき加算値が最も大きなカテゴリ名を採用したりすることができる。
【0038】
なお、図7のフローチャートにおいて、対称とする文書データに選択した会社名が入っておらず他の会社名が抽出された場合も(図7ステップA4:YES)、ここから処理を始める。選択された会社名がない場合、システム側から文書データに含まれる会社を抽出してオペレータに提案するようにするものである。
【0039】
次に、登録先判定部12が、図6(a)の辞書1を参照して、決定されたカテゴリ名に対応する業務名を特定する(ステップB3)。これで対称とする文書ファイルのカテゴリ名と業務名が決定する。次に、テキスト検索部12が図4のテーブル1,2のキーワードについてテキスト検索を行い(ステップB4)、何らかの会社名(または略称、別名)がヒットしたらステップB6へと進む(ステップB5)。文書ファイルにいずれの会社名もない場合(ステップB5:NO)、表示部30からエラーメッセージを通知して処理を終了する(ステップB12)。
【0040】
次に、登録先判定部12は図5のテーブル3を参照し、抽出された会社の決定された業務フォルダが利用可能であるかを確認する(ステップB6)。これは該当する箇所のレコードが「1」であるかを確認することにより行われる。利用可能(ステップB6:YES)である場合、登録先判定部12は、後にオペレータに提示される登録先候補リストにその会社名を登録する(ステップB7)。業務フォルダが利用不能である場合(ステップB6:NO)、リストには登録せずにステップB8へと進む。次に、会社名や略称をキーとした検索で他にヒットした会社名が存在するかをチェックし(ステップB8)、もしあれば、すべての会社について決定された業務フォルダが利用可能であるかを確認してから登録先候補リストに登録する。また、図7の処理においてオペレータに指定された会社の業務フォルダが利用不能であった場合(ステップA7:NO)も、このステップB8で文書内にある他の会社名を抽出し、登録先候補リストに登録する。
【0041】
文書ファイルに含まれるすべての会社名を確認した後、この登録先候補リストに会社名のデータが存在すれば(ステップB9)、表示部30からリストを提示してオペレータによる選択を受け付ける(ステップB10)。この画面例を図12に示す。本図に示すように、文書ファイルに登場する複数の会社名が提示されて選択できるようになっている。オペレータがいずれかの会社を選択し(反転表示させ)、確定キーを押下すると、登録先判定部12が対称となる文書ファイルと選択された会社の業務フォルダとの関連づけを行い、文書ファイルをファイル格納部23に保存する。すなわち、決定された文書カテゴリ名をファイル名またはその一部に採用し、選択された会社名フォルダの配下にある決定した業務フォルダ内にこの文書ファイルを登録する。ステップB9でリストにデータがない場合、すなわち文書ファイルに該当業務を利用可能な顧客会社名が存在しなかった場合、いずれの会社のファイルとして扱ってよいか分からないため、エラーメッセージを表示して処理を終了する(ステップB12)。
【0042】
以上に本発明のデータ管理システム、方法、およびプログラムの最良と考えられる実施例について詳細に説明したが、本発明は上記実施例に限定されず、様々な変形例、変更例として実現することができる。図13、14は、このような変形例の構成を示す図である。図13に示す例は、クライアント−サーバ型システムであり、図1に示す制御部10の要素がクライアント端末上にあり、図1に示す記憶部20の要素が、前記クライアント端末とネットワークで接続されたサーバ上にある。このようなシステムは、財務処理システムで扱うデータがサーバ上で一元管理され、複数のクライアント端末がこれにアクセスするといった業務形態に適している。本実施例では、クライアント端末の通信部50からネットワークを介してサーバの通信部、制御部を介して記憶部20のデータへアクセスするが、その他の動作や処理は上述した実施例と何ら変わるものではないため、これ以上の説明はここに省略する。
【0043】
図14に示す実施例では、これから登録先が決定される文書データが格納される文書データ群一時格納領域21がクライアント端末上にある以外は、図13に示す実施例と同様である。このようなシステムは、例えばクライアント−サーバ型の財務処理システムにおいて、個々のクライアント端末で作成された文書ファイルをそのまま保存するような場合に適している。この場合も、データやテーブルの保存場所以外の処理や動作は同様である。
【0044】
その他、上述した実施例では、システムのオペレータは最上位のフォルダ(会社名フォルダ)のみを指定または選択し、その下の文書ファイルが登録されるべき下位フォルダはシステム側が決定するようにしているが、これは処理速度や便宜性を考慮したものであって、本例に限定する趣旨ではない。例えば、オペレータが文書ファイルの登録先の全部またはある程度までを指定して、システム側が文書内容から指定されたパス全体について適切かどうかを判断する構成としてもよい。
【0045】
また、上述の実施例では図5のテーブル3のような利用可能なフォルダ(登録場所)の情報を管理し、これを参照して登録先候補となるフォルダが利用可能か否かをチェックするようにしているが(例えば図7ステップA7や図10ステップB6)、これは必ずしも必須の構成ではなく、例えば最終的に文書データを保存しようとするときに該当するフォルダが存在しない場合に新しくフォルダを作成するかを問い合わせるような運用としてもよい。
【0046】
また、上述した実施例では、図6(b)の辞書2を用いて文書カテゴリ名すなわちファイル名またはその一部を決定し、これに基づいて図6(a)の辞書1を参照して業務フォルダ名を決定しているが、文書カテゴリ名(ファイル名)の決定は必須の構成要素ではない。文書ファイル名は例えばオペレータが指定してもよく、また前から付されているものをそのまま使用するようにしてもよい。このように本願発明の処理内でファイル名を決定しない場合は、図6に示すような2段階の辞書を用意する必要はなく、業務名に対応するキーワードを登録した辞書を1つ用意すればよい。逆に、例えばファイル格納領域23が3またはそれ以上の階層のフォルダ(ディレクトリ)構造である場合は、これに対応する数の辞書を用意して格納すべきフォルダを決定できるようにする。このように本発明のデータ管理システムを適用するコンピュータシステムの目的や仕様によって文書ファイルが登録されるファイル格納部のフォルダ(ディレクトリ)構造は任意に設計されてもよく、これに応じてテーブル格納領域22に用意されるテーブルや辞書を、様々な階層のフォルダを辿っていけるように適宜構成する。これは当業者であれば格別の困難なく実現できるものであり、このような変形例はすべて本発明の技術的範囲に含まれると解すべきである。
【0047】
以上、詳細に説明したように、本発明の文書管理システムによれば、予め文書データの登録場所に関するキーワードが登録された1以上のテーブルを参照して文書データのテキスト情報を検索し、抽出されるキーワードから当該文書データの登録場所またはその候補を自動的に決定するものであるため、間違った場所に文書データを保存する事態が防止される。また、機械的に登録作業を決定するため、文書内容に対する登録先の関係の一貫性を保つことができる。
【産業上の利用可能性】
【0048】
本発明のデータ管理システム、方法およびプログラムは、特に本願出願人により提供される財務処理システムへの利用に適している他、ある程度の規則性に則ってフォルダ階層が構築される文書ファイルが管理される業務システム全般における文書データの管理に広く利用することができる。
【図面の簡単な説明】
【0049】
【図1】図1は、本発明の一実施例にかかるデータ管理システムの構成例を示す図である。
【図2】図2は、図1に示すデータ管理システムの制御部10と記憶部20の詳細を示す概略図である。
【図3】図3は、記憶部20のファイル格納部23のフォルダ構造の一例を示す図である。
【図4】図4(a)は、図3に示す上位フォルダ名と会社名との対応関係を定義するテーブルである。図4(b)は、会社名とその略称または別名との対応関係を定義するテーブルである。
【図5】図5は、図3に示す下層フォルダが利用可能か否かを関連づけるためのテーブルである。
【図6】図6(a)は、文書カテゴリ名と業務フォルダ名の対応関係を定義する辞書である。図6(b)は、キーワードと文書カテゴリ名の対応関係を定義する辞書である。
【図7】図7は、予め登録先がオペレータにより選択されている場合の本発明にかかるシステムの動作を説明するフローチャートである。
【図8】図8は、表示部30の画面例であり、仮登録された文書データの選択画面である。
【図9】図9は、表示部30の画面例であり、図8のステップA1においてオペレータが登録先を選択する画面である。
【図10】図10は、予め登録先が選択されていない場合の本発明にかかるシステム雄動作例を説明するフローチャートである。
【図11】図11は、図10のフローチャートでエラー終了した場合の画面例を示す図である。
【図12】図12は、図10ステップB10でオペレータに提示される登録先選択画面の例である。
【図13】図13は、本発明のデータ管理システムの別の実施例の構成を示す概略図である。
【図14】図14は、本発明のデータ管理システムの別の実施例の構成を示す概略図である。
【符号の説明】
【0050】
10 制御部
11 選択および処理指示部
12 テキスト検索部
13 登録先判定部
20 記憶部
21 文書データ群一時格納領域
22 テーブル格納領域
23 ファイル格納部
30 表示部
40 入力部
50 通信部
201 上位フォルダ群
202 業務フォルダ群
203 文書データ群
【技術分野】
【0001】
本発明は、文書データを保存するデータ管理システムに関し、特に、データ内容に基づいて登録場所の妥当性を判断したり適切な登録場所を提案したりするデータ管理システムおよび方法並びにプログラムに関する。
【背景技術】
【0002】
今日、会計事務所の多くは財務処理専門のコンピュータシステムを導入して業務を行っており、このようなシステムの仕様に基づいて顧客毎に膨大な数のデータを管理している。例えば、ある財務システムでは、記憶領域に図3に示すような顧客毎のフォルダ(ディレクトリ)階層が構築される。図3に示すように、顧客名に対応するフォルダの下に財務システムの業務ユニット名である会計・税務・一般の3つの下層フォルダが作成され、これらのフォルダ内に当該顧客の業務毎に関連して作成された個々のデータファイルが登録される。なお、このシステムでは新規顧客を登録すると自動的に会計・税務・一般の3つのフォルダが作成されるが、会計事務所が顧客からどの業務を請け負うかは顧客との取り決めにより、請け負わない業務に関するフォルダは使用されない。これが図3において斜線で示されるフォルダである。
【0003】
電子ファイリングに関する従来技術として、画像をスキャナで読み込み、OCR処理を行って得たテキストデータを検索タイトルとしてイメージデータと対応づけて記憶するシステムが提案されている(例えば、特許文献1、2)。また、本願出願人は、ファイル内に含まれる顧客情報と、コピー先または移動先フォルダの管理情報に含まれる顧客情報とを照合することにより、ファイルをコピーまたは移動すべきフォルダと異なるフォルダを選択するという人為的な操作ミスを防ぐための技術を提案している(例えば、特許文献3)。
【特許文献1】特開平10−162016号公報
【特許文献2】特開平8−137971号公報
【特許文献3】特開2007−200283号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1、2の技術では、ファイルの保存場所はオペレータが指定するため、本来登録すべき保存場所と異なる場所が間違って指定され、オペレータが気付かずに登録してしまう可能性があった。また、例えば特許文献1の技術において画像ファイルに関連づけられる検索タイトルは、画像ファイルから抽出したテキストデータを最大許容量まで取り込んで残りを切り捨てたものに過ぎず、抽出情報の取捨選択が行われないためそのファイルがどのような業務と関連するかが必ずしも分からなかった。この場合もオペレータが手動で登録先を決定することとなるが、その分類ポリシーはオペレータの判断に委ねられるため、異なるオペレータによる判断基準の相違や熟練度による判断基準の変化などで、ファイルの関連づけの一貫性が保たれない可能性があった。
【0005】
また、上記特許文献3のシステムは、顧客情報が整合しないファイルのコピーや移動を防止しうるものであるが、例えば図3に示すシステムのように顧客毎に複数のフォルダ階層が構築されるような場合には利用できない。
【0006】
したがって、データの登録時に指定した場所が果たして正しい登録場所かを判定し、あるいはデータの登録時にデータ内容からシステム側が適切な登録場所を提示するようなデータ管理システム、方法、プログラムが求められていた。
【課題を解決するための手段】
【0007】
本発明にかかるデータ管理システムは、上記課題を解決するためになされたものであり、文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部と、前記テキスト検索部から出力される検索情報を用いて前記文書データの登録場所またはその候補を決定する登録先判定部とを具え、前記登録先判定部は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する登録先を抽出することにより前記文書データの登録場所またはその候補を決定することを最も主要な特徴とする。
【0008】
このデータ管理システムは、さらに、前記システムのオペレータから前記文書ファイルの登録場所の指定を受け付ける入力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所と、前記入力手段で指定された文書ファイルの登録場所とを照合して、前記指定された登録場所が妥当か否かを判定することが有効である。
【0009】
さらに、前記コンピュータシステムのオペレータに前記文書データの登録場所の候補を提示する出力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所を前記オペレータに提示して、当該オペレータが選択した登録先に前記文書データを登録することが有効である。
【0010】
また、前記テーブル格納領域に、前記記憶領域における登録場所の情報に関するテーブルが格納されているとともに、前記登録先判定部がさらに、前記登録場所の情報に関するテーブルを参照して前記文書データの登録場所またはその候補として決定した登録場所が利用可能か否かを確認することが有効である。
【0011】
さらに、光学式読取(OCR)手段を具え、画像データにOCR処理を行ってテキスト情報を生成し、前記画像データの登録場所またはその候補を決定することが有効である。
【0012】
実施例によっては、前記文書データが登録される記憶領域および前記テーブル格納領域が通信ネットワークに接続された文書サーバ内にあるとともに、前記テキスト検索部および登録先判定部が前記ネットワークに接続されたクライアント端末内にあってもよい。
【発明の効果】
【0013】
本発明の文書管理システムは、予め文書データの登録場所に関するキーワードが登録された1以上のテーブルを参照して文書データのテキスト情報を検索し、抽出されるキーワードから当該文書データの登録場所またはその候補を自動的に決定するものであるため、間違った場所に文書データを登録してしまうといった事態が防止される。また、1以上のテーブルに登録されたキーワードに基づいて機械的に登録作業を決定するため、オペレータが恣意的に登録場所を決定する運用に比べ、文書内容に対する登録先の関係の一貫性を保つことができる。
【0014】
また、システムのオペレータにより登録場所を指定されている場合、この指定先と決定した登録場所を照合して妥当性を判断するため、オペレータが間違った登録場所を指定していた場合でも、この間違った場所に文書データが登録されるのを未然に防ぐことができる。
【0015】
また、登録先判定部が決定した登録場所の候補をシステムのオペレータに提示することにより、登録場所が指定されていない場合や間違った場所が指定されていた場合に、オペレータを正しい登録場所に導くことができる。データ保管場所の一貫性が保たれるとともに、オペレータが自分で判断してデータの登録場所を指定する労力を軽減することができる。さらに、自動的にデータを登録すべき場所を提示してくれるため、特に社内LANなど比較的複雑化したシステムにおいてシステムや操作に知識のない者でも容易に正しい場所にデータを登録することができる。
【0016】
また、システムが登録場所の情報に関するテーブルを具え、決定した登録場所が利用可能かを確認することにより、例えば財務処理専門のコンピュータシステムにおいて顧客と取り決めのない、すなわち利用すべきでない業務フォルダにデータが登録されるのを防止することができる。
【0017】
また、OCR処理を行いテキストデータを取得して検索をかけることにより、画像形式で取り込まれるデータに対しても自動的に登録先を決定することができる。
【0018】
また、通信ネットワークを介してクライアント端末から文書登録サーバに文書データを登録するように構成することにより、例えば社内LANなどで接続された複数の端末で扱う多数の文書データを一元的かつ一貫性を持たせて管理することができる。
【発明を実施するための最良の形態】
【0019】
本発明を実施するための最良の形態について、図面を参照しながら以下に詳細に説明する。図1は、本発明の一実施例にかかるデータ管理システムの構成例を示す図である。前提として、本実施例のコンピュータシステムは例えば会計事務所で利用されるものであり、財務処理プログラム(図示せず)が実装されているものとする。本実施例にかかるシステム、方法およびプログラムは、このような財務処理プログラムの運用中に作成または取り込まれる文書データについてオペレータから指定される登録先の妥当性を検証し、あるいは適切な登録先を提示して、データ保管場所の一貫性を保たんとするものである。
【0020】
本実施例のシステムは所謂スタンドアロン型であり、一般的なコンピュータシステムに本発明にかかるデータ管理プログラムをインストールして構成することができる。図1に示すように、このシステムは、制御部10と、記憶部20と、表示部30と、入力部40と、通信部50とを具えている。制御部10は中央処理装置を含み、本発明にかかるデータ管理プログラムを実行して各種処理を行う。記憶部20は、文書データが登録されるHDDといった大容量記録装置の他に、RAM、ROMなどの各種メモリも含む概念であり、さらに外付けハードディスクなどの外部記憶装置やDVD−RWなどの可搬型記憶媒体であってもよい。また、後述する実施例(図13および図14)のように、ネットワークを介して接続された他のコンピュータ端末内に存在してもよい。
【0021】
表示部30は、CRTまたはLCD(液晶ディスプレイ)などで構成され、このコンピュータシステムのオペレータに文書ファイルや各種メッセージを表示する。入力部40は、例えばキーボード41やマウス42であり、オペレータが各種情報を入力するのに用いられる。また、入力部40は登録対象となる文書データを取り込むスキャナ(図示せず)を具えてもよい。通信部50は、ネットワーク(インターネットやWAN、LAN)に対しデータの送受信を行い、必要な通信プロトコルを実装している。ただし、スタンドアロン型の本実施例では通信部50は必ずしも必要ではない。
【0022】
本発明にかかるファイル管理プログラムは、例えばシステムが具えるCD−ROMドライブ(図示せず)にセットされたCD−ROMから、記憶部20にインストールされる。そして、プログラムの実行時に記憶部20から読み出されて所定の場所に展開される。このようにして、制御部10は記憶部20に格納されたプログラムに従って、後述する処理を実行する。なお、ファイル管理プログラムはCD−ROMからではなく、他の磁気ディスク、磁気テープ、光ディスクなどの記録媒体からこのコンピュータシステムにインストールされてもよい。また、ネットワークを通じて電子メールやインターネットダウンロードなどの伝送媒体により提供されてもよい。
【0023】
図2は、図1に示すコンピュータシステムの制御部10と記憶部20の構成をより詳細に示す図である。本図に示すように、制御部10は、選択および処理指示部11と、テキスト検索部12と、登録先判定部13とを具えている。これらの要素は本発明のデータ管理プログラムの個々のプログラムモジュールであり、中央処理装置や一時メモリなどのハードウェアとの協働により実現される。選択および処理指示部11は、入力部40からオペレータによる文書データの選択やデータ登録処理の指示を受けて実行する。テキスト検索部12は、所定のテーブルまたは辞書(記憶部20のテーブル格納領域22)に基づいて、保存される文書データのテキスト情報を検索し、キーワードを抽出する。登録先判定部13は、抽出されたキーワードに基づいてテーブルまたは辞書を参照し、当該文書データの登録先またはその候補を決定する。なお、図2では制御部10の要素として特に重要なもののみを示すが、本発明は後述する処理に必要な他の様々なプログラムモジュールまたは手段を具えるものとする。
【0024】
記憶部20は、未分類すなわちこれから登録場所が決定される文書データが一時的に格納される文書データ群一次保存領域21と、文書データの登録場所の決定に必要な各種テーブルまたは辞書が登録されるテーブル格納領域22と、最終的に文書データが保存されるファイル格納部23とを具えている。
【0025】
ここで、本実施例におけるファイル格納部23の構造を図3に示す。上述したように、本実施例のコンピュータシステムは財務処理システムとして構成され、その仕様によって本図に示すようなフォルダ(ディレクトリ)階層が構築されている。図3に示すように、本実施例では顧問先ごとに上位フォルダ群201が作成され、その下の階層に会計、税務、および一般といった業務ごとに3つずつのフォルダ群202が作成され、これらのフォルダ内に当該顧客の業務毎に関連する個々のデータファイルが登録される。なお、この財務処理プログラムでは新規顧客を登録すると自動的に会計・税務・一般の3つのフォルダが作成されるが、会計事務所が顧客からどの業務を請け負うかは顧客との取り決めにより、請け負わない業務に関するフォルダは使用されない。このフォルダが図3において概念的に斜線で示されている。なお、フォルダ(ディレクトリ)構造は本実施例に限るものではなく、例えば会計年度やグループ会社などで細分され、より多くの階層をもつ構造としてもよい。
【0026】
図4乃至図6は、本実施例におけるテーブル格納領域22に登録されたテーブルおよび辞書の内容を示す図である。これらのテーブルおよび辞書は、テキスト検索部12および登録先判断部13により利用される。図4(a)は、図3に示す上位フォルダ群201と会社名とを関連づけるテーブル1であり、顧客ごとに一意に設定される管理番号と、上位フォルダ名と、会社名とが関連づけられている。一方、図4(b)に示すテーブル2は、個々の文書データで用いられる可能性のある会社の略称や別名などをテーブル1の上位フォルダ名と関連づけるテーブルであり、テーブル1にて設定された管理番号と、略称または別名リストとが関連づけられている。例えば、テーブル1で「ABC工業」との上位フォルダ名で管理される「株式会社ABC工業」に設定された管理番号1に、「株式会社ABC工業」、「(株)ABC」、「エービーシー東京」などの考えられる略称または別名が関連づけられる。同様に、管理番号2で管理される「DEF商事株式会社」には、「デー・イー・エフ」や「DEF商事(株)」などの略称または別名が関連づけられている。このテーブル2により、文書ファイル内に正式な社名(テーブル1記載の社名)が用いられていない場合でも、テーブル2にリストアップされた略称や別名があればその会社に関連する文書であると関連付けることが可能となる。
【0027】
次に、図5に示すテーブル3は、ファイル格納部23で文書ファイルの登録先として利用可能なフォルダを管理するテーブルであり、顧客の管理番号ごとに、会計、税務、一般の3つの下層フォルダ202のどのフォルダが利用可能かが関連づけられている。ここで、フォルダが利用可能すなわち顧客からその業務を請け負っている場合には「1」、使用しない場合には「0」が登録される。 本実施例では図3に示すように「DEF商事」の一般フォルダと、「GHI産業」の会計フォルダが使用されておらず、これに対応してテーブル3では管理番号2(DEF商事に相当)の「一般」欄と管理番号3(GHI産業に相当)の「会計」欄に「0」が登録され、それ以外の欄に「1」が登録される。
【0028】
これらのテーブル1乃至3の情報は、コンピュータシステムで動作する財務処理プログラムで新規顧客を登録するときに新規レコードとして作成されるものである。すなわち、財務処理プログラム上でオペレータが新規顧客を登録すると、図3に示すフォルダ構造に3つの下位フォルダ(会計・税務・一般フォルダ)を有する1つの上位フォルダ(会社名フォルダ)が自動的に作成されるとともに、テーブル1に管理番号が設定され、オペレータが入力した顧客の会社名を用いて新規顧客の会社名とフォルダ名が登録される。また、オペレータの指定により、あるいは入力された会社名から自動的に、その会社の略称または別名がテーブル2に登録される。ここで、自動的に略称または別名を登録するには、オペレータが漢字変換する前の入力内容から読み方を抽出したり、システムがアルファベット各文字とその読み方の片仮名表記の対照表を予め具えており、例えば「ABC」を含む会社名から「エー・ビー・シー」なる別名を抽出するようにプログラミングすることが考えられる。さらに、新規顧客の登録時にオペレータによって指定される請負業務の情報から、テーブル3の情報が登録される。これらの情報は予めテーブル1乃至3に登録されるものであるが、その処理は財務処理プログラムの動作であって、本発明のデータ管理プログラムの動作とは直接的に関連せず、また当業者であれば容易に理解できるため、これ以上の詳細な説明は本明細書では省略する。
【0029】
図6(a)および(b)は、文書データに含まれるキーワードから当該文書データがどの業務に関連するかを導き出すための辞書の一例を示す図である。図6(a)に示す辞書1は、本実施例のシステムで用いる業務名(会計・税務・一般)と、各業務に関連する文書カテゴリ名が関連づけられている。また、図6(b)の辞書2では、辞書1に登録された文書カテゴリに関連する複数のキーワードが登録されている。また、これは必須ではないが、各キーワードには重要度に応じた重み付けの数値が設定されている。これらの辞書1、2は、本発明にかかるデータ管理システム、方法、およびプログラムが適用されるコンピュータシステムの使用目的に応じて、本発明にかかるシステムまたはプログラムの出荷時、あるいはシステムの運用開始時に予め登録されるものとする。本実施例では会計事務所用のコンピュータシステムを想定しているが、他の業種で用いられるテーブルや辞書は他の構成となることは明らかである。
【0030】
このように構成されたデータ管理システムの動作を、図7以降を用いて詳細に説明する。図7は、本発明にかかるデータ管理方法の実施例を説明するためのフローチャートである。本図は、対象とする文書データの登録先がオペレータに指定されている場合の動作である。ここで、保存対象となる文書データは、図1の記憶部20の文書データ群格納領域21に一時的に格納されている。この文書データは、テキストデータを含んだ電子ファイルのことを指し、例えばワープロや表計算ソフトで作成されたファイルでもよいし、本システムで動作する財務処理プログラムで直前に作成されたものでもよい、また、予め財務処理プログラムや他のソフトウェアで作成され文書データ群一時格納領域21にプールされたもの、メール添付やインターネットダウンロードやLAN内の他の端末からネットワークを介して受け取ったものであってもよい。さらに、このシステムに接続されたスキャナ等の文書読取装置(図示せず)から取得され、OCR処理によりテキスト情報が付された画像データであってもよい。
【0031】
本実施例では、最初にシステムのオペレータにより文書データの指定と登録場所の選択を受け付ける(ステップA1)。図8は、文書データ選択時に表示部30からオペレータに提示される画面例である。本図に示すように、一時格納領域21に登録された文書データ群が表示部30にリスト提示され、オペレータが入力部40を操作していずれか1以上のファイルを選択できるようになっている。このリストには、ファイル名、形式、作成日付の情報が提示される。オペレータは対象とするファイルを例えばマウスでクリックすることにより反転表示させ、下にある確定ボタンを押下する。
【0032】
次に図9に示すような登録先選択画面が表示部30に提示され、同様にオペレータがファイルの登録場所を選択して確定ボタンを押下する。制御部10の選択および処理指示部11がこの入力を受け、文書データ群から該当する文書ファイルを抽出するとともにテキスト検索部12に処理を受け渡す。なお、本実施例では、オペレータは図3に示す会社毎の上位フォルダ201のみを指定し、その下の業務フォルダの指定は行わない。一方、システム側は文書内容に基づいて適切な会社名が指定されているかのチェックを行った上で、文書内容からどの業務フォルダに納まるべきかを判断し、自動的にファイルがそのフォルダに登録されるよう構成される。ただし、ステップA1でオペレータが2またはそれ以上の階層のパスを指定し、システム側がこれをすべてチェックする構成としてもよい。
【0033】
次に、制御部10のテキスト検索部12が、図4に示すテーブル1および2に登録された会社名およびその略称、別名をキーとして、文書ファイルのテキスト検索を行う(ステップA2)。これにより、文書ファイル内にいずれかの会社名または略称や別名が記載されている場合にそれが抽出される。具体的には、テキスト検索部12は、テーブル1の会社名およびテーブル2の略称または別名リストのすべてについて検索を行い、ヒットした会社名、略称または別名の管理番号を抽出し、検索結果を登録先判定部13に出力する。登録先判定部13は、ステップA1で選択された会社が文書ファイルの検索結果に含まれるかを判定する(ステップA3)。具体的には、ヒットした会社名等の管理番号がオペレータに選択された会社の管理番号と一致するか否かを比較する。1つの文書ファイル内に複数の会社名が検出された場合、本実施例では、検出された会社名のいずれか1つが選択された会社名と一致すればステップA3の判断はYESとする。ただし、別の実施例では、例えば文書ファイル内に最も多く出現する会社名のみを比較するようにしてもよい。ステップA3で選択された会社名が含まれればステップA5へ進み、文書ファイル内にオペレータに指定された会社名が含まれない場合はステップA4へと進む。
【0034】
文書ファイル内に指定された会社名がない場合、選択された登録先以外の会社名が含まれているかを判断する(ステップA4)。もしあれば、後述する図10のフローチャートへと移行する。なければ、そのままステップA5へ進む。
【0035】
ステップA5では、再びテキスト検索部12が辞書2のキーワードについてテキスト検索を行い、その結果により登録先判定部13が文書カテゴリ名を決定する(ステップA5)。ここで、文書カテゴリ名の決定方法は幾つか考えられるが、例えば最初にヒットしたキーワードに対応する文書カテゴリ名を採用する方法、ヒットした回数が最も多い文書カテゴリ名を採用する方法、図6(b)に示す辞書2に示すようにキーワード毎に重み付け情報を付加して、各キーワードのヒット回数に重み付け数値を乗じた値を文書カテゴリ名ごとに加算し、最も大きい値となった文書カテゴリ名を採用する方法等が考えられる。
【0036】
次に、登録先判定部13は図6(a)の辞書1を参照し、決定した文書カテゴリ名に対応する業務名を抽出する(ステップA6)。ここで抽出される業務名に対応する業務フォルダが、文書ファイルを登録すべきフォルダとして決定される。さらに、登録先判定部13は図5のテーブル3を参照して、該当する会社の業務フォルダが利用可能かを確認する(ステップA7)。利用可能であれば、文書ファイルをオペレータの選択した会社名のフォルダ内の該当する業務フォルダに関連づけて、ファイル格納部23に格納する(ステップA8)。本実施例では、このとき辞書2で抽出された文書カテゴリ名をファイル名またはその一部として採用し、辞書1で決定された業務フォルダに登録する。一方、決定された業務フォルダが利用可能でなければ、オペレータに選択された登録先に登録できないため、後述する登録先候補の提示処理へと進む(B:図10ステップB8へ)。別の実施例では、図11に示すように登録先の再選択を促す画面を表示して、この入力を受けて再びステップA1から繰り返すようにしてもよい。
【0037】
次に、図10のフローチャートを用いて、文書データの登録先が予めオペレータによって選択されていない場合の動作例を説明する。本実施例の方法は、予め登録先が指定されていない文書データについて、そのテキスト内容から登録先の候補を抽出してオペレータに選択させるものである。まず、選択および処理指示部11が、文書データ群一時格納領域21に登録されている文書データ群をオペレータに提示して、登録対象となる文書データの選択を促す(ステップB1)。この処理は図8の画面をオペレータに提示して行われる。ファイルの指定を受けたら、テキスト検索部12が図6(b)の辞書2のキーワードについて文書データのテキスト検索を行い、登録先判定部13がヒットしたキーワードから文書カテゴリ名を決定する(ステップB2)。これは図7のステップA5と同じであり、最初にヒットしたキーワードが属するカテゴリ名を採用したり、キーワード毎に重み付けを付与しておき加算値が最も大きなカテゴリ名を採用したりすることができる。
【0038】
なお、図7のフローチャートにおいて、対称とする文書データに選択した会社名が入っておらず他の会社名が抽出された場合も(図7ステップA4:YES)、ここから処理を始める。選択された会社名がない場合、システム側から文書データに含まれる会社を抽出してオペレータに提案するようにするものである。
【0039】
次に、登録先判定部12が、図6(a)の辞書1を参照して、決定されたカテゴリ名に対応する業務名を特定する(ステップB3)。これで対称とする文書ファイルのカテゴリ名と業務名が決定する。次に、テキスト検索部12が図4のテーブル1,2のキーワードについてテキスト検索を行い(ステップB4)、何らかの会社名(または略称、別名)がヒットしたらステップB6へと進む(ステップB5)。文書ファイルにいずれの会社名もない場合(ステップB5:NO)、表示部30からエラーメッセージを通知して処理を終了する(ステップB12)。
【0040】
次に、登録先判定部12は図5のテーブル3を参照し、抽出された会社の決定された業務フォルダが利用可能であるかを確認する(ステップB6)。これは該当する箇所のレコードが「1」であるかを確認することにより行われる。利用可能(ステップB6:YES)である場合、登録先判定部12は、後にオペレータに提示される登録先候補リストにその会社名を登録する(ステップB7)。業務フォルダが利用不能である場合(ステップB6:NO)、リストには登録せずにステップB8へと進む。次に、会社名や略称をキーとした検索で他にヒットした会社名が存在するかをチェックし(ステップB8)、もしあれば、すべての会社について決定された業務フォルダが利用可能であるかを確認してから登録先候補リストに登録する。また、図7の処理においてオペレータに指定された会社の業務フォルダが利用不能であった場合(ステップA7:NO)も、このステップB8で文書内にある他の会社名を抽出し、登録先候補リストに登録する。
【0041】
文書ファイルに含まれるすべての会社名を確認した後、この登録先候補リストに会社名のデータが存在すれば(ステップB9)、表示部30からリストを提示してオペレータによる選択を受け付ける(ステップB10)。この画面例を図12に示す。本図に示すように、文書ファイルに登場する複数の会社名が提示されて選択できるようになっている。オペレータがいずれかの会社を選択し(反転表示させ)、確定キーを押下すると、登録先判定部12が対称となる文書ファイルと選択された会社の業務フォルダとの関連づけを行い、文書ファイルをファイル格納部23に保存する。すなわち、決定された文書カテゴリ名をファイル名またはその一部に採用し、選択された会社名フォルダの配下にある決定した業務フォルダ内にこの文書ファイルを登録する。ステップB9でリストにデータがない場合、すなわち文書ファイルに該当業務を利用可能な顧客会社名が存在しなかった場合、いずれの会社のファイルとして扱ってよいか分からないため、エラーメッセージを表示して処理を終了する(ステップB12)。
【0042】
以上に本発明のデータ管理システム、方法、およびプログラムの最良と考えられる実施例について詳細に説明したが、本発明は上記実施例に限定されず、様々な変形例、変更例として実現することができる。図13、14は、このような変形例の構成を示す図である。図13に示す例は、クライアント−サーバ型システムであり、図1に示す制御部10の要素がクライアント端末上にあり、図1に示す記憶部20の要素が、前記クライアント端末とネットワークで接続されたサーバ上にある。このようなシステムは、財務処理システムで扱うデータがサーバ上で一元管理され、複数のクライアント端末がこれにアクセスするといった業務形態に適している。本実施例では、クライアント端末の通信部50からネットワークを介してサーバの通信部、制御部を介して記憶部20のデータへアクセスするが、その他の動作や処理は上述した実施例と何ら変わるものではないため、これ以上の説明はここに省略する。
【0043】
図14に示す実施例では、これから登録先が決定される文書データが格納される文書データ群一時格納領域21がクライアント端末上にある以外は、図13に示す実施例と同様である。このようなシステムは、例えばクライアント−サーバ型の財務処理システムにおいて、個々のクライアント端末で作成された文書ファイルをそのまま保存するような場合に適している。この場合も、データやテーブルの保存場所以外の処理や動作は同様である。
【0044】
その他、上述した実施例では、システムのオペレータは最上位のフォルダ(会社名フォルダ)のみを指定または選択し、その下の文書ファイルが登録されるべき下位フォルダはシステム側が決定するようにしているが、これは処理速度や便宜性を考慮したものであって、本例に限定する趣旨ではない。例えば、オペレータが文書ファイルの登録先の全部またはある程度までを指定して、システム側が文書内容から指定されたパス全体について適切かどうかを判断する構成としてもよい。
【0045】
また、上述の実施例では図5のテーブル3のような利用可能なフォルダ(登録場所)の情報を管理し、これを参照して登録先候補となるフォルダが利用可能か否かをチェックするようにしているが(例えば図7ステップA7や図10ステップB6)、これは必ずしも必須の構成ではなく、例えば最終的に文書データを保存しようとするときに該当するフォルダが存在しない場合に新しくフォルダを作成するかを問い合わせるような運用としてもよい。
【0046】
また、上述した実施例では、図6(b)の辞書2を用いて文書カテゴリ名すなわちファイル名またはその一部を決定し、これに基づいて図6(a)の辞書1を参照して業務フォルダ名を決定しているが、文書カテゴリ名(ファイル名)の決定は必須の構成要素ではない。文書ファイル名は例えばオペレータが指定してもよく、また前から付されているものをそのまま使用するようにしてもよい。このように本願発明の処理内でファイル名を決定しない場合は、図6に示すような2段階の辞書を用意する必要はなく、業務名に対応するキーワードを登録した辞書を1つ用意すればよい。逆に、例えばファイル格納領域23が3またはそれ以上の階層のフォルダ(ディレクトリ)構造である場合は、これに対応する数の辞書を用意して格納すべきフォルダを決定できるようにする。このように本発明のデータ管理システムを適用するコンピュータシステムの目的や仕様によって文書ファイルが登録されるファイル格納部のフォルダ(ディレクトリ)構造は任意に設計されてもよく、これに応じてテーブル格納領域22に用意されるテーブルや辞書を、様々な階層のフォルダを辿っていけるように適宜構成する。これは当業者であれば格別の困難なく実現できるものであり、このような変形例はすべて本発明の技術的範囲に含まれると解すべきである。
【0047】
以上、詳細に説明したように、本発明の文書管理システムによれば、予め文書データの登録場所に関するキーワードが登録された1以上のテーブルを参照して文書データのテキスト情報を検索し、抽出されるキーワードから当該文書データの登録場所またはその候補を自動的に決定するものであるため、間違った場所に文書データを保存する事態が防止される。また、機械的に登録作業を決定するため、文書内容に対する登録先の関係の一貫性を保つことができる。
【産業上の利用可能性】
【0048】
本発明のデータ管理システム、方法およびプログラムは、特に本願出願人により提供される財務処理システムへの利用に適している他、ある程度の規則性に則ってフォルダ階層が構築される文書ファイルが管理される業務システム全般における文書データの管理に広く利用することができる。
【図面の簡単な説明】
【0049】
【図1】図1は、本発明の一実施例にかかるデータ管理システムの構成例を示す図である。
【図2】図2は、図1に示すデータ管理システムの制御部10と記憶部20の詳細を示す概略図である。
【図3】図3は、記憶部20のファイル格納部23のフォルダ構造の一例を示す図である。
【図4】図4(a)は、図3に示す上位フォルダ名と会社名との対応関係を定義するテーブルである。図4(b)は、会社名とその略称または別名との対応関係を定義するテーブルである。
【図5】図5は、図3に示す下層フォルダが利用可能か否かを関連づけるためのテーブルである。
【図6】図6(a)は、文書カテゴリ名と業務フォルダ名の対応関係を定義する辞書である。図6(b)は、キーワードと文書カテゴリ名の対応関係を定義する辞書である。
【図7】図7は、予め登録先がオペレータにより選択されている場合の本発明にかかるシステムの動作を説明するフローチャートである。
【図8】図8は、表示部30の画面例であり、仮登録された文書データの選択画面である。
【図9】図9は、表示部30の画面例であり、図8のステップA1においてオペレータが登録先を選択する画面である。
【図10】図10は、予め登録先が選択されていない場合の本発明にかかるシステム雄動作例を説明するフローチャートである。
【図11】図11は、図10のフローチャートでエラー終了した場合の画面例を示す図である。
【図12】図12は、図10ステップB10でオペレータに提示される登録先選択画面の例である。
【図13】図13は、本発明のデータ管理システムの別の実施例の構成を示す概略図である。
【図14】図14は、本発明のデータ管理システムの別の実施例の構成を示す概略図である。
【符号の説明】
【0050】
10 制御部
11 選択および処理指示部
12 テキスト検索部
13 登録先判定部
20 記憶部
21 文書データ群一時格納領域
22 テーブル格納領域
23 ファイル格納部
30 表示部
40 入力部
50 通信部
201 上位フォルダ群
202 業務フォルダ群
203 文書データ群
【特許請求の範囲】
【請求項1】
文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部と、前記テキスト検索部から出力される検索情報を用いて前記文書データの登録場所またはその候補を決定する登録先判定部とを具え、前記登録先判定部は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する登録先を抽出することにより前記文書データの登録場所またはその候補を決定することを特徴とするデータ管理システム。
【請求項2】
請求項1に記載のデータ管理システムにおいて、さらに、前記システムのオペレータから前記文書データの登録場所の指定を受け付ける入力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所と、前記入力手段で指定された文書データの登録場所とを照合して、前記指定された登録場所が妥当か否かを判定することを特徴とするデータ管理システム。
【請求項3】
請求項1または2に記載のデータ管理システムにおいて、さらに、前記コンピュータシステムのオペレータに前記文書データの登録場所の候補を提示する出力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所を前記オペレータに提示して、当該オペレータが選択した登録先に前記文書データを登録することを特徴とするデータ管理システム。
【請求項4】
請求項1乃至3のいずれか1項に記載のデータ管理システムにおいて、前記テーブル格納領域に、前記記憶領域における登録場所の情報に関するテーブルが格納されているとともに、前記登録先判定部がさらに、前記登録場所の情報に関するテーブルを参照して前記文書データの登録場所またはその候補として決定した登録場所が利用可能か否かを確認することを特徴とするデータ管理システム。
【請求項5】
請求項1乃至4のいずれか1項に記載のデータ管理システムにおいて、さらに光学式読取(OCR)手段を具え、画像データにOCR処理を行ってテキスト情報を生成し、前記画像データの登録場所またはその候補を決定することを特徴とするデータ管理システム。
【請求項6】
請求項1乃至5のいずれか1項に記載のデータ管理システムにおいて、前記文書データが登録される記憶領域および前記テーブル格納領域が通信ネットワークに接続された文書サーバ内にあるとともに、前記テキスト検索部および登録先判定部が前記ネットワークに接続されたクライアント端末内にあることを特徴とするデータ管理システム。
【請求項7】
文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域とを具えるコンピュータシステムにおけるデータ管理方法であって、
テキスト検索部が登録される文書データを取得するステップと、
前記テキスト検索部が前記テーブルのキーワードについて文書データのテキスト情報を検索するステップと、
登録先判定部がこの検索で抽出されたキーワードについて、前記テーブルを参照して対応する登録先を抽出するステップと、
前記登録先判定部が前記抽出した登録先を前記文書データの登録場所またはその候補として決定するステップとを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項8】
請求項7に記載のデータ管理方法がさらに、
前記コンピュータシステムのオペレータから前記文書データの登録先の指定を受け付けるステップと、
前記登録先判定部が前記文書データの登録場所またはその候補として決定した登録先と、前記指定された登録先とを照合して、当該指定された登録先が妥当か否かを判定するステップとを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項9】
請求項7または8に記載のデータ管理方法がさらに、
前記登録先判定部が前記文書データの登録場所またはその候補として決定した1以上の登録先を前記コンピュータシステムのオペレータに提示して選択を促すステップと、
前記オペレータに選択された保存先に前記文書データを登録するステップとを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項10】
請求項7乃至9のいずれか1項に記載のデータ管理方法において、前記テーブル格納領域に、前記記憶領域における登録先の情報に関するテーブルが格納されているとともに、前記方法が、当該登録先に関するテーブルを参照して、前記文書データの登録場所またはその候補として決定した登録先が利用可能か否かを確認するステップを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項11】
請求項7乃至10のいずれか1項に記載のデータ管理方法をコンピュータに実行させることを特徴とするプログラム。
【請求項1】
文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域と、前記テーブルのキーワードについて前記文書データのテキスト情報を検索するテキスト検索部と、前記テキスト検索部から出力される検索情報を用いて前記文書データの登録場所またはその候補を決定する登録先判定部とを具え、前記登録先判定部は、テキスト検索部により前記文書データから抽出されたキーワードに基づき前記テーブルを参照し、対応する登録先を抽出することにより前記文書データの登録場所またはその候補を決定することを特徴とするデータ管理システム。
【請求項2】
請求項1に記載のデータ管理システムにおいて、さらに、前記システムのオペレータから前記文書データの登録場所の指定を受け付ける入力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所と、前記入力手段で指定された文書データの登録場所とを照合して、前記指定された登録場所が妥当か否かを判定することを特徴とするデータ管理システム。
【請求項3】
請求項1または2に記載のデータ管理システムにおいて、さらに、前記コンピュータシステムのオペレータに前記文書データの登録場所の候補を提示する出力手段を具えるとともに、前記登録先判定部は、前記文書データの登録場所またはその候補として決定した登録場所を前記オペレータに提示して、当該オペレータが選択した登録先に前記文書データを登録することを特徴とするデータ管理システム。
【請求項4】
請求項1乃至3のいずれか1項に記載のデータ管理システムにおいて、前記テーブル格納領域に、前記記憶領域における登録場所の情報に関するテーブルが格納されているとともに、前記登録先判定部がさらに、前記登録場所の情報に関するテーブルを参照して前記文書データの登録場所またはその候補として決定した登録場所が利用可能か否かを確認することを特徴とするデータ管理システム。
【請求項5】
請求項1乃至4のいずれか1項に記載のデータ管理システムにおいて、さらに光学式読取(OCR)手段を具え、画像データにOCR処理を行ってテキスト情報を生成し、前記画像データの登録場所またはその候補を決定することを特徴とするデータ管理システム。
【請求項6】
請求項1乃至5のいずれか1項に記載のデータ管理システムにおいて、前記文書データが登録される記憶領域および前記テーブル格納領域が通信ネットワークに接続された文書サーバ内にあるとともに、前記テキスト検索部および登録先判定部が前記ネットワークに接続されたクライアント端末内にあることを特徴とするデータ管理システム。
【請求項7】
文書データが登録される記憶領域と、文書データの登録場所に関連するキーワードが登録された1以上のテーブルを格納するテーブル格納領域とを具えるコンピュータシステムにおけるデータ管理方法であって、
テキスト検索部が登録される文書データを取得するステップと、
前記テキスト検索部が前記テーブルのキーワードについて文書データのテキスト情報を検索するステップと、
登録先判定部がこの検索で抽出されたキーワードについて、前記テーブルを参照して対応する登録先を抽出するステップと、
前記登録先判定部が前記抽出した登録先を前記文書データの登録場所またはその候補として決定するステップとを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項8】
請求項7に記載のデータ管理方法がさらに、
前記コンピュータシステムのオペレータから前記文書データの登録先の指定を受け付けるステップと、
前記登録先判定部が前記文書データの登録場所またはその候補として決定した登録先と、前記指定された登録先とを照合して、当該指定された登録先が妥当か否かを判定するステップとを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項9】
請求項7または8に記載のデータ管理方法がさらに、
前記登録先判定部が前記文書データの登録場所またはその候補として決定した1以上の登録先を前記コンピュータシステムのオペレータに提示して選択を促すステップと、
前記オペレータに選択された保存先に前記文書データを登録するステップとを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項10】
請求項7乃至9のいずれか1項に記載のデータ管理方法において、前記テーブル格納領域に、前記記憶領域における登録先の情報に関するテーブルが格納されているとともに、前記方法が、当該登録先に関するテーブルを参照して、前記文書データの登録場所またはその候補として決定した登録先が利用可能か否かを確認するステップを前記コンピュータシステムに実行させることを特徴とするデータ管理方法。
【請求項11】
請求項7乃至10のいずれか1項に記載のデータ管理方法をコンピュータに実行させることを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公開番号】特開2009−181479(P2009−181479A)
【公開日】平成21年8月13日(2009.8.13)
【国際特許分類】
【出願番号】特願2008−21774(P2008−21774)
【出願日】平成20年1月31日(2008.1.31)
【出願人】(591008605)株式会社日本デジタル研究所 (73)
【Fターム(参考)】
【公開日】平成21年8月13日(2009.8.13)
【国際特許分類】
【出願日】平成20年1月31日(2008.1.31)
【出願人】(591008605)株式会社日本デジタル研究所 (73)
【Fターム(参考)】
[ Back to top ]