データ管理装置、データ登録方法、および、プログラム
【課題】頻繁に更新されるデータであっても、人手による作業を介さないで、重複するデータの登録を防止する。
【解決手段】データ受付部11は、端末装置20から複数項目から構成されるデータを受信し、データ登録部12は受信したデータを登録票に仮登録する。そして、類似データ判定部13は、まず、類似判定項目を用いて行う第1の類似データ判定と、類似判定項目以外の項目を用いて行う第2の類似データ判定とを時系列で実施する。続いて、類似データ判定部13は、第2の類似データ判定で類似がなく登録可能なデータであると判定された場合に、再度、類似判定項目を用いて第3の類似データ判定を実施し、類似(重複)の有無を判断して、仮登録したデータの登録、非登録を決定する。
【解決手段】データ受付部11は、端末装置20から複数項目から構成されるデータを受信し、データ登録部12は受信したデータを登録票に仮登録する。そして、類似データ判定部13は、まず、類似判定項目を用いて行う第1の類似データ判定と、類似判定項目以外の項目を用いて行う第2の類似データ判定とを時系列で実施する。続いて、類似データ判定部13は、第2の類似データ判定で類似がなく登録可能なデータであると判定された場合に、再度、類似判定項目を用いて第3の類似データ判定を実施し、類似(重複)の有無を判断して、仮登録したデータの登録、非登録を決定する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数項目から構成されるデータを登録票に登録するデータ管理装置、データ登録方法、および、プログラムに関する。
【背景技術】
【0002】
統計をとることなどを目的に、ユーザから入力されたデータやOCR(Optical Character Reader)等により伝票などから読み取ったデータをコンピュータに記憶することが行われている。この場合、同じ種類のデータが重複して登録されてしまい、記憶したデータから正しい統計を得ることができなくなってしまう問題がある。
具体的には、来店する顧客の購入データを収集して1日の来店客数を把握したい場合に、同一人物が1日に複数回購入した場合に、その人物の購入データが複数登録されてしまい、正しい統計(来店客数)を得ることができなくなってしまうという問題がある。
【0003】
このような問題を防ぐため、登録前にそのような重複するデータを登録対象から外す作業を手動で実施することが行われている。または、重複するデータの登録を許容し、重複するデータがあることを前提にして、登録されたデータから統計を求めることが行われている。
【0004】
また、特許文献1(特開2008−181244号公報)には、同じユーザ識別情報を含むユーザレコードが既に記憶されていないことを条件に、新たなユーザレコードを生成してユーザテーブルに追加することで、データの重複を防ぐことが記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−181244号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
重複したデータを登録対象から外す処理を手作業で実施する場合、手間がかかり面倒であり、また人による作業なのでミスも多い。また、重複するデータを許容して統計を出す場合は、データにより重複する割合が異なるため、正確な統計を得ることは困難であった。
【0007】
また、特許文献1では、登録するデータの重複の有無を判定している間に、記憶されているデータに新規登録や更新がなされた場合、データの重複の有無を正しく判定することができなくなってしまうという問題があった。
【0008】
本発明は、上記実情に鑑みてなされたものであり、人手による作業を介さないで、重複するデータの登録を確実に防止することができるデータ管理装置、データ登録方法、および、プログラムを提供することを目的とする。
また、本発明は、頻繁に更新されるデータであっても、重複するデータの登録を防止することができるデータ管理装置、データ登録方法、および、プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明の第1の観点に係るデータ管理装置は、
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたデータ管理装置であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段と、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段と、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段と、を備え、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とする。
【0010】
上記目的を達成するため、本発明の第2の観点に係るデータ登録方法は、
複数の項目から構成される新規データを受け付け、受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録ステップを備えたデータ登録方法であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、複数の項目から構成されるデータが登録されている登録票に登録されているか否かを判別する第1判別ステップと、
前記第1判別ステップにより類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別ステップと、
前記第2判別ステップにより類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別ステップと、を備え、
前記登録ステップは、前記第2判別ステップにより類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別ステップにより登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とする。
【0011】
上記目的を達成するため、本発明の第3の観点に係るプログラムは、
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたコンピュータを、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段、
として機能させることを特徴とするプログラムであって、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とする。
【発明の効果】
【0012】
本発明によれば、人手による作業を介さないで、重複するデータの登録を防止することができる。また、頻繁に更新されるデータであっても、重複するデータの登録を防止することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の第1実施形態に係るデータ管理装置の構成を示す図である。
【図2】登録票の具体例を示す図である。
【図3】登録処理の動作を説明するためのフローチャートである。
【図4】再判定処理の動作を説明するためのフローチャートである。
【図5】登録処理の具体例を説明するための図である。
【図6】登録処理の具体例を説明するための図である。
【図7】登録処理の具体例を説明するための図である。
【図8】登録処理の具体例を説明するための図である。
【図9】登録処理の具体例を説明するための図である。
【図10】登録処理の具体例を説明するための図である。
【図11】本発明の第2実施形態に係るデータ管理装置の構成を示す図である。
【図12】各実施形態に係るデータ管理装置をコンピュータに実装する場合の、物理的な構成の一例を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は下記の実施形態及び図面によって限定されるものではない。本発明の要旨を変更しない範囲で下記の実施形態及び図面に変更を加えることが出来るのはもちろんである。また、図中同一または相当部分には同一符号を付す。
【0015】
(第1実施形態)
本発明の第1実施形態に係るデータ管理装置10について説明する。データ管理装置10は、図1に示すように、インターネットなどのネットワークN1を介して、複数の端末装置20に接続される。端末装置20は、ユーザによって操作される一般的なPC(Personal Computer)等である。端末装置20は、複数の項目からなるデータをデータ管理装置10に送信する。データ管理装置10は、統計等をとるために、端末装置20から送信されるデータを登録票に登録して記憶する。
【0016】
データ管理装置10は、データ受付部11と、データ登録部12と、類似データ判定部13と、登録票記憶部14と、類似判定項目記憶部15と、判定用データ一時記憶部16とを備える。
【0017】
データ受付部11は、端末装置20からネットワークN1を介して送信されたデータを受信する。
【0018】
データ登録部12は、データ受付部11が受信したデータを登録票記憶部14に記憶されている登録票に仮登録する。また、データ登録部12は、類似データ判定部13による後述する類似判定の結果に基づいて、仮登録したデータの登録を確定(本登録)したり、仮登録したデータを削除したりする。
【0019】
類似データ判定部13は、登録票に登録されているデータのうち、データ受付部11が受信したデータと類似するデータ(類似データ)が有るか否かを判定(類似判定)する。
【0020】
登録票記憶部14には、登録票が記憶される。登録票は、端末装置20から受信したデータが記憶(登録)されるテーブルである。本実施形態では、図2に示すように、5つの項目「項目A」「項目B」「項目C」「項目D」「項目E」から構成されるデータが登録票に登録されるものとする。
【0021】
図1に戻り、類似判定項目記憶部15には、類似データ判定部13による類似判定で利用される項目(類似判定項目)の識別情報(例えば、項目名)が記憶される。類似判定項目は、例えば、人物情報を扱っているデータで有る場合には、「氏名」や「生年月日」など、そのデータの特徴を表すような項目であることが望ましい。
【0022】
判定用データ一時記憶部16は、類似データ判定部13が判定したデータを現在時刻情報と対応付けて一時的に記憶する。
【0023】
続いて、データ管理装置10で実施される、受信したデータを登録票に登録する処理(登録処理)の動作について説明する。なお、予め、判定用データ一時記憶部16に記憶されているデータは、消去(リセット)されているものとする。
【0024】
データ管理装置10のデータ受付部11が端末装置20からデータを受信すると、図3に示す登録処理が実施される。
【0025】
登録処理が開始されると、まず、データ登録部12は、データ受付部11が受信したデータを登録票記憶部14に記憶されている登録票に仮登録する(ステップS10)。
【0026】
続いて、類似データ判定部13は、仮登録したデータと類似判定項目の値が一致するデータが、登録票に登録されているか否かを判別する(ステップS20)。
【0027】
登録票に登録されていないと判別した場合(ステップS20;No)、データ登録部12は、登録票に仮登録したデータを本登録し(ステップS80)、登録処理は終了する。
【0028】
登録票に登録されていると判別した場合(ステップS20;Yes)、類似データ判定部13は、その登録されているデータと現在時刻情報とを対応付けて、判定用データ一時記憶部16に記憶する(ステップS30)。なお、登録されているデータが複数ある場合は、複数のデータを現在時刻情報と対応付けて判定用データ一時記憶部16に記憶する。
【0029】
続いて、類似データ判定部13は、類似判定項目以外の項目について、ステップS30で判定用データ一時記憶部16に記憶したデータと仮登録したデータとで値が一致するか否かを判別する(ステップS40)。
【0030】
一致すると判別した場合(ステップS40;Yes)、仮登録したデータと類似するデータが登録票内に既に存在していることがわかる。したがって、類似データ判定部13は、仮登録したデータを登録票から削除して(ステップS70)、登録処理は終了する。
【0031】
一致しないと判別した場合(ステップS40;No)、仮登録したデータと類似するデータは登録票内に存在しないはずである。しかしながら、仮登録から一連の判別処理(ステップS10〜ステップS40)までの間に、端末装置20やユーザからの指示により、新たに登録票に登録されたデータや、更新されたデータがある場合、これらのデータにより、仮登録したデータと類似するデータが登録票内に存在している可能性も考えられる。従って、一致しないと判別した場合(ステップS40;No)、類似データ判定部13は、再度、類似判定項目の値を用いて、仮登録されたデータと類似するデータが登録票内にあるか否かを判定する再判定処理を行う(ステップS50)。
【0032】
ここで、再判定処理の詳細について、図4のフローチャートを参照して説明する。
【0033】
再判定処理が開始されると、まず、類似データ判定部13は、仮登録したデータと類似判定項目の値が一致するデータが登録票に登録されているか否かを判別する(ステップS51)。なお、この処理は、ステップS20と実質的に同等な処理である。
【0034】
仮登録したデータと類似判定項目の値が一致するデータが登録票に登録されていないと判別した場合(ステップS51;No)、類似データ判定部13は、仮登録したデータと類似するデータ(類似データ)は登録票内に無いと判定し(ステップS55)、再判定処理は終了する。
【0035】
仮登録したデータと類似判定項目の値が一致するデータが登録票に登録されていると判別した場合(ステップS51;Yes)、類似データ判定部13は、その登録されているデータと現在時刻情報とを対応付けて、判定用データ一時記憶部16に記憶する(ステップS52)。なお、この処理により、判定用データ一時記憶部16には、ステップS52で記憶された今回のデータと、ステップS30で記憶された前回のデータとの2種類のデータが記憶されることとなる。
【0036】
続いて、類似データ判定部13は、判定用データ一時記憶部16を参照して、今回記憶したデータが、ステップS30で前回記憶したデータのうちに含まれているか否かを判別する(ステップS53)。
【0037】
含まれていないと判別した場合(ステップS53;No)、類似データ判定部13は、類似データが登録票内に有ると判定し(ステップS54)、再判定処理は終了する。
【0038】
含まれていると判別した場合(ステップS53;Yes)、類似データ判定部13は、類似データは登録票内に無いと判定し(ステップS55)、再判定処理は終了する。
【0039】
図3に戻り、再判定処理で類似データが有ると判定された場合(ステップS60;類似データ有り)、データ登録部12は、仮登録されているデータを登録票から削除して(ステップS70)、登録処理は終了する。
また、再判定処理で類似データが無いと判定された場合(ステップS60;類似データ無し)、データ登録部12は、仮登録されているデータを本登録して(ステップS80)、登録処理は終了する。
【0040】
続いて、上述した登録処理について、具体例を挙げて説明する。
前提として、予め、図2に示すデータが登録票に登録されているものとする。また、類似判定項目は、「項目B」「項目C」「項目D」に設定されているものとする。なお、以下の説明では、例えば、項目Aの値が「a1」、項目Bの値が「b1」、項目Cの値が「c1」、項目Dの値が「d1」、および、項目Eの値が「e1」であるデータを「a1,b1,c1,d1,e1」と表記する。
【0041】
このような状態で、端末装置20から、データ「a1,b6,c6,d6,e5」を受信した場合の処理について、図5を用いて説明する。この場合、このデータの類似判定項目(項目B,項目C,項目D)の値は「b6,c6,d6」であり、一致するデータは登録票内にないため(ステップS20;No)、仮登録されたデータ「a1,b6,c6,d6,e1」は登録票に登録される(ステップS80)。
【0042】
また、端末装置20から、「a1,b2,c3,d4,e5」のデータを受信した場合の処理について説明する。この場合、このデータの類似判定項目(項目B,項目C,項目D)の値は「b2,b3,b4」であり図2に示す登録票内のデータ「a1,b2,c3,d4,e5」と一致するため(ステップS20;Yes)、この一致したデータが判定用データ一時記憶部16に記憶される(ステップS30)。そして、判定用データ一時記憶部16に記憶したデータの類似判定項目以外の項目(項目A,項目E)の値「a1,e5」は、仮登録した受信データと一致するため(ステップS40;Yes)、類似データとなり、受信した「a1,b2,c3,d4,e5」は登録票から削除される(ステップS70)。
【0043】
また、端末装置20から、「a4,b1,c1,d1,e4」のデータを受信した場合の処理について、図6を用いて説明する。この場合、このデータの類似判定項目(項目B,項目C,項目D)の値は「b1,c1,d1」であり図2に示す登録票内のデータ「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」と一致するため(ステップS20;Yes)、この一致した2つのデータが判定用データ一時記憶部16に記憶される(ステップS30)。そして、この判定用データ一時記憶部16に記憶した2つのデータの類似判定項目以外の項目(項目A,項目E)の値「a1,e1」「a2,e3」は、仮登録したデータと一致しないため(ステップS40;No)、再判定処理(ステップS50)が実施される。
【0044】
この再判定処理において、登録票に記憶されているデータが、図2に示す内容のままである場合を考える。この場合、図7に示すように、類似判定項目の値が一致する2つのデータ「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」が記憶される(ステップS52)。そして、この記憶したデータと、ステップS30で前回記憶したデータとは一致するため(ステップS53;Yes)、類似データは無いと判定される(ステップS55)。従って、仮登録したデータ「a4,b1,c1,d1,e4」は登録票に登録される(ステップS80)。
【0045】
また、この再判定処理開始時に、新規データの追加や更新がなされており、登録票が図8に示す状態となっている場合を考える。図8では、登録票内のデータ「a2,b1,c1,d1,e3」が、「a2,b1,c2,d1,e3」に更新されている。この場合、再判定処理で、類似判定項目が一致するデータとして「a1,b1,c1,d1,e1」が判定用データ一時記憶部16に記憶される(ステップS52)。そして、この記憶したデータは、ステップS30で前回記憶したデータに含まれているため(ステップS53;Yes)、類似データは無いと判定される(ステップS55)。従って、受信した「a4,b1,c1,d1,e4」は登録票に登録される(ステップS80)。
【0046】
また、この再判定処理開始時に、新規データの追加や更新がなされて、登録票が図9に示す状態となっている場合を考える。図9では、登録票に新規データ「a6,b1,c1,d1,e6」が追加されている。この場合、再判定処理で、類似判定項目が一致するデータとして「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」「a6,b1,c1,d1,e6」の3つのデータが判定用データ一時記憶部16に記憶される(ステップS52)。そして、この記憶した3つのデータは、ステップS30で前回記憶したデータに含まれないため(ステップS53;No)、類似データは有ると判定される(ステップS54)。従って、受信した「a4,b1,c1,d1,e4」は登録される(ステップS70)。
【0047】
また、この再判定処理開始時に、新規データの追加や更新がなされて、登録票が図10に示す状態となっている場合を考える。図10では、登録票内のデータ「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」が「a1,b1,c2,d1,e1」「a2,b1,c2,d1,e3」に更新されている。この場合、再判定処理で、類似判定項目が一致するデータはないものと判別される(ステップS51;No)。従って、類似データは無いものと判定され(ステップS55)。従って、受信した「a4,b1,c1,d1,e4」は登録される(ステップS80)。
【0048】
このように、本実施形態では、類似判定項目を用いて行う第1の類似データ判定と、類似判定項目以外の項目を用いて行う第2の類似データ判定とを時系列で実施する。そして、第2の類似データ判定で類似がなく登録可能なデータであると判定された場合に、再度、類似判定項目を用いて第3の類似データ判定を実施し、類似(重複)の有無を判断して、データの登録、非登録を決定する。従って、人手による作業を介さないで、重複するデータの登録を確実に防止することができる。また、類似判定項目を用いて再度の判定を行うため、頻繁に更新されるデータであっても、重複するデータの登録を防止することができる。
【0049】
(第2実施形態)
第1実施形態に係るデータ管理装置10は、端末装置20からデータを受信する度に、類似性の有無を判定して類似しないデータの場合は登録票に登録し、類似するデータの場合は登録票から削除する登録処理を行った。第2実施形態では、端末装置20から受信したデータをまとめて保存しておき、後処理によりデータの類似性を判断することを特徴とする。
【0050】
第2実施形態に係るデータ管理装置30は、図11に示すように、データ保存部31と、受信データ一時記憶部32とを新たに備える。データ保存部31は、データ受付部11が端末装置20からデータを受信する度に、他のデータとの重複(類似)の有無に関係なく、受信したデータを受信データ一時記憶部32に保存する。
なお、下記及び図面では、第1実施形態と同様のものについては、同一の符号を付す。また、第1実施形態と同様の構成要素の詳細な説明は、上記第1実施形態、第2実施形態の説明に準じ、詳細な説明を省略する。
【0051】
第2実施形態に係るデータ管理装置30では、例えば、ユーザからの登録処理の開始の指示がなされた場合、又は、判定用データ一時記憶部16に記憶されているデータが所定数(例えば10)に達した場合に、図3に示す登録処理を実施する。この際、データ登録部12は、受信データ一時記憶部32に記憶されているデータを1つずつ選択して、選択したデータ毎に、仮登録をして、類似性を判定して、類似しないデータの場合は登録票に登録し、類似するデータの場合は登録票から削除する一連の処理(ステップS10〜ステップS80)を行う。従って、本実施形態では、端末装置20から受信したデータをまとめて保存して、後処理によりデータの類似性を判断することが可能となる。
【0052】
なお、上記各実施形態は種々の変形、および、応用が可能である。
例えば、ユーザからの類似判定項目の変更の指示をデータ管理装置20,30が受け付けて、受け付けた指示に応じて、類似判定項目記憶部15に記憶されている類似判定項目を適宜変更できるようにしてもよい。
【0053】
また、上記各実施形態では、端末装置20から受信されたデータを登録票に登録する処理について説明したが、ユーザが直接入力したデータや、OCRを用いて伝票などから読み取ったデータを登録する処理にも、本発明は適用可能である。
【0054】
また、上記各実施形態では、仮登録したデータに類似するデータが有る場合に登録票から削除したが、削除は行わないで当該データを保留状態にしてもよい。このようにすることで、ユーザが登録票内で保留状態となっているデータの内容を後で確認し、データの登録/削除を判断することができる。
【0055】
また、登録票がデータ管理装置10,30と接続された外部装置に記憶されていてもよい。
【0056】
図12は、本発明の各実施形態に係るデータ管理装置10,30をコンピュータに実装する場合の、物理的な構成の一例を示すブロック図である。本発明の各実施形態に係るデータ管理装置10,30は、一般的なコンピュータ装置と同様のハードウェア構成によって実現することができる。データ管理装置10,30は、制御部41、主記憶部42、外部記憶部43、操作部44、表示部45および入出力部46を備える。主記憶部42、外部記憶部43、操作部44、表示部45および入出力部46はいずれも内部バス48を介して制御部41に接続されている。
【0057】
制御部41はCPU(Central Processing Unit)等から構成され、外部記憶部43に記憶されている制御プログラム47に従って、前述した各実施形態における辞書作成処理を実行する。
【0058】
主記憶部42はRAM(Random-Access Memory)等から構成され、外部記憶部43に記憶されている制御プログラム47をロードし、制御部41の作業領域として用いられる。
【0059】
外部記憶部43は、フラッシュメモリ、ハードディスク、DVD−RAM(Digital Versatile Disc Random-Access Memory)、DVD−RW(Digital Versatile Disc ReWritable)等の不揮発性メモリから構成され、上述の処理を制御部41に行わせるための制御プログラム47を予め記憶する。また、外部記憶部43は、制御部41の指示に従って、この制御プログラム47が記憶するデータを制御部41に供給し、制御部41から供給されたデータを記憶する。また、外部記憶部43は、上述した各実施形態における登録票記憶部14、類似判定項目記憶部15、判定用データ一時記憶部16、および、受信データ一時記憶部32を物理的に実現する。
【0060】
操作部44はキーボードおよびマウスなどのポインティングデバイス等と、キーボードおよびポインティングデバイス等を内部バス48に接続するインターフェース装置等から構成されている。例えば、操作部44を介して、類似判定項目の変更の指示が制御部41に供給される。
【0061】
表示部45は、CRT(Cathode Ray Tube)またはLCD(Liquid Crystal Display)などから構成され、種々の情報を表示する。
【0062】
入出力部46は、無線送受信機、無線モデムまたは網終端装置、およびそれらと接続するシリアルインタフェースまたはLAN(Local Area Network)インタフェース等から構成されている。例えば、入出力部46は、端末装置20からのデータを受信する。
【0063】
図1、および図11に示すデータ管理装置10,30のデータ受付部11、データ登録部12、類似データ判定部13、および、データ保存部31の処理は、制御プログラム47が、制御部41、主記憶部42、外部記憶部43、操作部44、表示部45および入出力部46などを資源として用いて処理することによって実現される。
【0064】
なお、前記のハードウエェア構成やフローチャートは一例であり、任意に変更および修正が可能である。
【0065】
また、制御部41、主記憶部42、外部記憶部43、操作部44、表示部45、入出力部46および内部バス48などから構成されるデータ管理装置10,30の処理を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。たとえば、前記の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体(フレキシブルディスク、CD−ROM、DVD−ROM等)に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、前記の処理を実行するデータ管理装置10,30を構成してもよい。また、インターネット等の通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロード等することでデータ管理装置10,30を構成してもよい。
【0066】
また、データ管理装置10,30の機能を、OS(Operation System)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。
【0067】
また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS:Bulletin Board System)に前記コンピュータプログラムを掲示し、ネットワークを介して前記コンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行できるように構成してもよい。
【0068】
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0069】
(付記1)複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたデータ管理装置であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段と、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段と、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段と、を備え、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ管理装置。
【0070】
(付記2)前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データを一時的に記憶する手段をさらに備え、
前記第3判別手段は、類似判定項目の値が新規データと一致するデータが登録票に登録されていない場合、又は、類似判定項目の値が新規データと一致するデータが登録票に登録されており、該データが一時的に記憶したデータ内に含まれている場合に、登録票に登録されているデータのなかに新規データと類似するデータがあると判別する、
ことを特徴とする付記1に記載のデータ管理装置。
【0071】
(付記3)類似判定項目の変更の指示を受け付け、受け付けた変更の指示に基づいて類似判定項目を変更する類似判定項目変更手段をさらに備える、
ことを特徴とする付記1又は2に記載のデータ管理装置。
【0072】
(付記4)複数の項目から構成される新規データを受け付け、受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録ステップを備えたデータ登録方法であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、複数の項目から構成されるデータが登録されている登録票に登録されているか否かを判別する第1判別ステップと、
前記第1判別ステップにより類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別ステップと、
前記第2判別ステップにより類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別ステップと、を備え、
前記登録ステップは、前記第2判別ステップにより類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別ステップにより登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ登録方法。
【0073】
(付記5)複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたコンピュータを、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段、
として機能させることを特徴とするプログラムであって、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするプログラム。
【符号の説明】
【0074】
10 データ管理装置
11 データ受付部
12 データ登録部
13 類似データ判定部
14 登録票記憶部
15 類似判定項目記憶部
16 判定用データ一時記憶部
20 端末装置
N1 ネットワーク
【技術分野】
【0001】
本発明は、複数項目から構成されるデータを登録票に登録するデータ管理装置、データ登録方法、および、プログラムに関する。
【背景技術】
【0002】
統計をとることなどを目的に、ユーザから入力されたデータやOCR(Optical Character Reader)等により伝票などから読み取ったデータをコンピュータに記憶することが行われている。この場合、同じ種類のデータが重複して登録されてしまい、記憶したデータから正しい統計を得ることができなくなってしまう問題がある。
具体的には、来店する顧客の購入データを収集して1日の来店客数を把握したい場合に、同一人物が1日に複数回購入した場合に、その人物の購入データが複数登録されてしまい、正しい統計(来店客数)を得ることができなくなってしまうという問題がある。
【0003】
このような問題を防ぐため、登録前にそのような重複するデータを登録対象から外す作業を手動で実施することが行われている。または、重複するデータの登録を許容し、重複するデータがあることを前提にして、登録されたデータから統計を求めることが行われている。
【0004】
また、特許文献1(特開2008−181244号公報)には、同じユーザ識別情報を含むユーザレコードが既に記憶されていないことを条件に、新たなユーザレコードを生成してユーザテーブルに追加することで、データの重複を防ぐことが記載されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2008−181244号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
重複したデータを登録対象から外す処理を手作業で実施する場合、手間がかかり面倒であり、また人による作業なのでミスも多い。また、重複するデータを許容して統計を出す場合は、データにより重複する割合が異なるため、正確な統計を得ることは困難であった。
【0007】
また、特許文献1では、登録するデータの重複の有無を判定している間に、記憶されているデータに新規登録や更新がなされた場合、データの重複の有無を正しく判定することができなくなってしまうという問題があった。
【0008】
本発明は、上記実情に鑑みてなされたものであり、人手による作業を介さないで、重複するデータの登録を確実に防止することができるデータ管理装置、データ登録方法、および、プログラムを提供することを目的とする。
また、本発明は、頻繁に更新されるデータであっても、重複するデータの登録を防止することができるデータ管理装置、データ登録方法、および、プログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明の第1の観点に係るデータ管理装置は、
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたデータ管理装置であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段と、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段と、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段と、を備え、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とする。
【0010】
上記目的を達成するため、本発明の第2の観点に係るデータ登録方法は、
複数の項目から構成される新規データを受け付け、受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録ステップを備えたデータ登録方法であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、複数の項目から構成されるデータが登録されている登録票に登録されているか否かを判別する第1判別ステップと、
前記第1判別ステップにより類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別ステップと、
前記第2判別ステップにより類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別ステップと、を備え、
前記登録ステップは、前記第2判別ステップにより類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別ステップにより登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とする。
【0011】
上記目的を達成するため、本発明の第3の観点に係るプログラムは、
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたコンピュータを、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段、
として機能させることを特徴とするプログラムであって、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とする。
【発明の効果】
【0012】
本発明によれば、人手による作業を介さないで、重複するデータの登録を防止することができる。また、頻繁に更新されるデータであっても、重複するデータの登録を防止することができる。
【図面の簡単な説明】
【0013】
【図1】本発明の第1実施形態に係るデータ管理装置の構成を示す図である。
【図2】登録票の具体例を示す図である。
【図3】登録処理の動作を説明するためのフローチャートである。
【図4】再判定処理の動作を説明するためのフローチャートである。
【図5】登録処理の具体例を説明するための図である。
【図6】登録処理の具体例を説明するための図である。
【図7】登録処理の具体例を説明するための図である。
【図8】登録処理の具体例を説明するための図である。
【図9】登録処理の具体例を説明するための図である。
【図10】登録処理の具体例を説明するための図である。
【図11】本発明の第2実施形態に係るデータ管理装置の構成を示す図である。
【図12】各実施形態に係るデータ管理装置をコンピュータに実装する場合の、物理的な構成の一例を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。なお、本発明は下記の実施形態及び図面によって限定されるものではない。本発明の要旨を変更しない範囲で下記の実施形態及び図面に変更を加えることが出来るのはもちろんである。また、図中同一または相当部分には同一符号を付す。
【0015】
(第1実施形態)
本発明の第1実施形態に係るデータ管理装置10について説明する。データ管理装置10は、図1に示すように、インターネットなどのネットワークN1を介して、複数の端末装置20に接続される。端末装置20は、ユーザによって操作される一般的なPC(Personal Computer)等である。端末装置20は、複数の項目からなるデータをデータ管理装置10に送信する。データ管理装置10は、統計等をとるために、端末装置20から送信されるデータを登録票に登録して記憶する。
【0016】
データ管理装置10は、データ受付部11と、データ登録部12と、類似データ判定部13と、登録票記憶部14と、類似判定項目記憶部15と、判定用データ一時記憶部16とを備える。
【0017】
データ受付部11は、端末装置20からネットワークN1を介して送信されたデータを受信する。
【0018】
データ登録部12は、データ受付部11が受信したデータを登録票記憶部14に記憶されている登録票に仮登録する。また、データ登録部12は、類似データ判定部13による後述する類似判定の結果に基づいて、仮登録したデータの登録を確定(本登録)したり、仮登録したデータを削除したりする。
【0019】
類似データ判定部13は、登録票に登録されているデータのうち、データ受付部11が受信したデータと類似するデータ(類似データ)が有るか否かを判定(類似判定)する。
【0020】
登録票記憶部14には、登録票が記憶される。登録票は、端末装置20から受信したデータが記憶(登録)されるテーブルである。本実施形態では、図2に示すように、5つの項目「項目A」「項目B」「項目C」「項目D」「項目E」から構成されるデータが登録票に登録されるものとする。
【0021】
図1に戻り、類似判定項目記憶部15には、類似データ判定部13による類似判定で利用される項目(類似判定項目)の識別情報(例えば、項目名)が記憶される。類似判定項目は、例えば、人物情報を扱っているデータで有る場合には、「氏名」や「生年月日」など、そのデータの特徴を表すような項目であることが望ましい。
【0022】
判定用データ一時記憶部16は、類似データ判定部13が判定したデータを現在時刻情報と対応付けて一時的に記憶する。
【0023】
続いて、データ管理装置10で実施される、受信したデータを登録票に登録する処理(登録処理)の動作について説明する。なお、予め、判定用データ一時記憶部16に記憶されているデータは、消去(リセット)されているものとする。
【0024】
データ管理装置10のデータ受付部11が端末装置20からデータを受信すると、図3に示す登録処理が実施される。
【0025】
登録処理が開始されると、まず、データ登録部12は、データ受付部11が受信したデータを登録票記憶部14に記憶されている登録票に仮登録する(ステップS10)。
【0026】
続いて、類似データ判定部13は、仮登録したデータと類似判定項目の値が一致するデータが、登録票に登録されているか否かを判別する(ステップS20)。
【0027】
登録票に登録されていないと判別した場合(ステップS20;No)、データ登録部12は、登録票に仮登録したデータを本登録し(ステップS80)、登録処理は終了する。
【0028】
登録票に登録されていると判別した場合(ステップS20;Yes)、類似データ判定部13は、その登録されているデータと現在時刻情報とを対応付けて、判定用データ一時記憶部16に記憶する(ステップS30)。なお、登録されているデータが複数ある場合は、複数のデータを現在時刻情報と対応付けて判定用データ一時記憶部16に記憶する。
【0029】
続いて、類似データ判定部13は、類似判定項目以外の項目について、ステップS30で判定用データ一時記憶部16に記憶したデータと仮登録したデータとで値が一致するか否かを判別する(ステップS40)。
【0030】
一致すると判別した場合(ステップS40;Yes)、仮登録したデータと類似するデータが登録票内に既に存在していることがわかる。したがって、類似データ判定部13は、仮登録したデータを登録票から削除して(ステップS70)、登録処理は終了する。
【0031】
一致しないと判別した場合(ステップS40;No)、仮登録したデータと類似するデータは登録票内に存在しないはずである。しかしながら、仮登録から一連の判別処理(ステップS10〜ステップS40)までの間に、端末装置20やユーザからの指示により、新たに登録票に登録されたデータや、更新されたデータがある場合、これらのデータにより、仮登録したデータと類似するデータが登録票内に存在している可能性も考えられる。従って、一致しないと判別した場合(ステップS40;No)、類似データ判定部13は、再度、類似判定項目の値を用いて、仮登録されたデータと類似するデータが登録票内にあるか否かを判定する再判定処理を行う(ステップS50)。
【0032】
ここで、再判定処理の詳細について、図4のフローチャートを参照して説明する。
【0033】
再判定処理が開始されると、まず、類似データ判定部13は、仮登録したデータと類似判定項目の値が一致するデータが登録票に登録されているか否かを判別する(ステップS51)。なお、この処理は、ステップS20と実質的に同等な処理である。
【0034】
仮登録したデータと類似判定項目の値が一致するデータが登録票に登録されていないと判別した場合(ステップS51;No)、類似データ判定部13は、仮登録したデータと類似するデータ(類似データ)は登録票内に無いと判定し(ステップS55)、再判定処理は終了する。
【0035】
仮登録したデータと類似判定項目の値が一致するデータが登録票に登録されていると判別した場合(ステップS51;Yes)、類似データ判定部13は、その登録されているデータと現在時刻情報とを対応付けて、判定用データ一時記憶部16に記憶する(ステップS52)。なお、この処理により、判定用データ一時記憶部16には、ステップS52で記憶された今回のデータと、ステップS30で記憶された前回のデータとの2種類のデータが記憶されることとなる。
【0036】
続いて、類似データ判定部13は、判定用データ一時記憶部16を参照して、今回記憶したデータが、ステップS30で前回記憶したデータのうちに含まれているか否かを判別する(ステップS53)。
【0037】
含まれていないと判別した場合(ステップS53;No)、類似データ判定部13は、類似データが登録票内に有ると判定し(ステップS54)、再判定処理は終了する。
【0038】
含まれていると判別した場合(ステップS53;Yes)、類似データ判定部13は、類似データは登録票内に無いと判定し(ステップS55)、再判定処理は終了する。
【0039】
図3に戻り、再判定処理で類似データが有ると判定された場合(ステップS60;類似データ有り)、データ登録部12は、仮登録されているデータを登録票から削除して(ステップS70)、登録処理は終了する。
また、再判定処理で類似データが無いと判定された場合(ステップS60;類似データ無し)、データ登録部12は、仮登録されているデータを本登録して(ステップS80)、登録処理は終了する。
【0040】
続いて、上述した登録処理について、具体例を挙げて説明する。
前提として、予め、図2に示すデータが登録票に登録されているものとする。また、類似判定項目は、「項目B」「項目C」「項目D」に設定されているものとする。なお、以下の説明では、例えば、項目Aの値が「a1」、項目Bの値が「b1」、項目Cの値が「c1」、項目Dの値が「d1」、および、項目Eの値が「e1」であるデータを「a1,b1,c1,d1,e1」と表記する。
【0041】
このような状態で、端末装置20から、データ「a1,b6,c6,d6,e5」を受信した場合の処理について、図5を用いて説明する。この場合、このデータの類似判定項目(項目B,項目C,項目D)の値は「b6,c6,d6」であり、一致するデータは登録票内にないため(ステップS20;No)、仮登録されたデータ「a1,b6,c6,d6,e1」は登録票に登録される(ステップS80)。
【0042】
また、端末装置20から、「a1,b2,c3,d4,e5」のデータを受信した場合の処理について説明する。この場合、このデータの類似判定項目(項目B,項目C,項目D)の値は「b2,b3,b4」であり図2に示す登録票内のデータ「a1,b2,c3,d4,e5」と一致するため(ステップS20;Yes)、この一致したデータが判定用データ一時記憶部16に記憶される(ステップS30)。そして、判定用データ一時記憶部16に記憶したデータの類似判定項目以外の項目(項目A,項目E)の値「a1,e5」は、仮登録した受信データと一致するため(ステップS40;Yes)、類似データとなり、受信した「a1,b2,c3,d4,e5」は登録票から削除される(ステップS70)。
【0043】
また、端末装置20から、「a4,b1,c1,d1,e4」のデータを受信した場合の処理について、図6を用いて説明する。この場合、このデータの類似判定項目(項目B,項目C,項目D)の値は「b1,c1,d1」であり図2に示す登録票内のデータ「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」と一致するため(ステップS20;Yes)、この一致した2つのデータが判定用データ一時記憶部16に記憶される(ステップS30)。そして、この判定用データ一時記憶部16に記憶した2つのデータの類似判定項目以外の項目(項目A,項目E)の値「a1,e1」「a2,e3」は、仮登録したデータと一致しないため(ステップS40;No)、再判定処理(ステップS50)が実施される。
【0044】
この再判定処理において、登録票に記憶されているデータが、図2に示す内容のままである場合を考える。この場合、図7に示すように、類似判定項目の値が一致する2つのデータ「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」が記憶される(ステップS52)。そして、この記憶したデータと、ステップS30で前回記憶したデータとは一致するため(ステップS53;Yes)、類似データは無いと判定される(ステップS55)。従って、仮登録したデータ「a4,b1,c1,d1,e4」は登録票に登録される(ステップS80)。
【0045】
また、この再判定処理開始時に、新規データの追加や更新がなされており、登録票が図8に示す状態となっている場合を考える。図8では、登録票内のデータ「a2,b1,c1,d1,e3」が、「a2,b1,c2,d1,e3」に更新されている。この場合、再判定処理で、類似判定項目が一致するデータとして「a1,b1,c1,d1,e1」が判定用データ一時記憶部16に記憶される(ステップS52)。そして、この記憶したデータは、ステップS30で前回記憶したデータに含まれているため(ステップS53;Yes)、類似データは無いと判定される(ステップS55)。従って、受信した「a4,b1,c1,d1,e4」は登録票に登録される(ステップS80)。
【0046】
また、この再判定処理開始時に、新規データの追加や更新がなされて、登録票が図9に示す状態となっている場合を考える。図9では、登録票に新規データ「a6,b1,c1,d1,e6」が追加されている。この場合、再判定処理で、類似判定項目が一致するデータとして「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」「a6,b1,c1,d1,e6」の3つのデータが判定用データ一時記憶部16に記憶される(ステップS52)。そして、この記憶した3つのデータは、ステップS30で前回記憶したデータに含まれないため(ステップS53;No)、類似データは有ると判定される(ステップS54)。従って、受信した「a4,b1,c1,d1,e4」は登録される(ステップS70)。
【0047】
また、この再判定処理開始時に、新規データの追加や更新がなされて、登録票が図10に示す状態となっている場合を考える。図10では、登録票内のデータ「a1,b1,c1,d1,e1」「a2,b1,c1,d1,e3」が「a1,b1,c2,d1,e1」「a2,b1,c2,d1,e3」に更新されている。この場合、再判定処理で、類似判定項目が一致するデータはないものと判別される(ステップS51;No)。従って、類似データは無いものと判定され(ステップS55)。従って、受信した「a4,b1,c1,d1,e4」は登録される(ステップS80)。
【0048】
このように、本実施形態では、類似判定項目を用いて行う第1の類似データ判定と、類似判定項目以外の項目を用いて行う第2の類似データ判定とを時系列で実施する。そして、第2の類似データ判定で類似がなく登録可能なデータであると判定された場合に、再度、類似判定項目を用いて第3の類似データ判定を実施し、類似(重複)の有無を判断して、データの登録、非登録を決定する。従って、人手による作業を介さないで、重複するデータの登録を確実に防止することができる。また、類似判定項目を用いて再度の判定を行うため、頻繁に更新されるデータであっても、重複するデータの登録を防止することができる。
【0049】
(第2実施形態)
第1実施形態に係るデータ管理装置10は、端末装置20からデータを受信する度に、類似性の有無を判定して類似しないデータの場合は登録票に登録し、類似するデータの場合は登録票から削除する登録処理を行った。第2実施形態では、端末装置20から受信したデータをまとめて保存しておき、後処理によりデータの類似性を判断することを特徴とする。
【0050】
第2実施形態に係るデータ管理装置30は、図11に示すように、データ保存部31と、受信データ一時記憶部32とを新たに備える。データ保存部31は、データ受付部11が端末装置20からデータを受信する度に、他のデータとの重複(類似)の有無に関係なく、受信したデータを受信データ一時記憶部32に保存する。
なお、下記及び図面では、第1実施形態と同様のものについては、同一の符号を付す。また、第1実施形態と同様の構成要素の詳細な説明は、上記第1実施形態、第2実施形態の説明に準じ、詳細な説明を省略する。
【0051】
第2実施形態に係るデータ管理装置30では、例えば、ユーザからの登録処理の開始の指示がなされた場合、又は、判定用データ一時記憶部16に記憶されているデータが所定数(例えば10)に達した場合に、図3に示す登録処理を実施する。この際、データ登録部12は、受信データ一時記憶部32に記憶されているデータを1つずつ選択して、選択したデータ毎に、仮登録をして、類似性を判定して、類似しないデータの場合は登録票に登録し、類似するデータの場合は登録票から削除する一連の処理(ステップS10〜ステップS80)を行う。従って、本実施形態では、端末装置20から受信したデータをまとめて保存して、後処理によりデータの類似性を判断することが可能となる。
【0052】
なお、上記各実施形態は種々の変形、および、応用が可能である。
例えば、ユーザからの類似判定項目の変更の指示をデータ管理装置20,30が受け付けて、受け付けた指示に応じて、類似判定項目記憶部15に記憶されている類似判定項目を適宜変更できるようにしてもよい。
【0053】
また、上記各実施形態では、端末装置20から受信されたデータを登録票に登録する処理について説明したが、ユーザが直接入力したデータや、OCRを用いて伝票などから読み取ったデータを登録する処理にも、本発明は適用可能である。
【0054】
また、上記各実施形態では、仮登録したデータに類似するデータが有る場合に登録票から削除したが、削除は行わないで当該データを保留状態にしてもよい。このようにすることで、ユーザが登録票内で保留状態となっているデータの内容を後で確認し、データの登録/削除を判断することができる。
【0055】
また、登録票がデータ管理装置10,30と接続された外部装置に記憶されていてもよい。
【0056】
図12は、本発明の各実施形態に係るデータ管理装置10,30をコンピュータに実装する場合の、物理的な構成の一例を示すブロック図である。本発明の各実施形態に係るデータ管理装置10,30は、一般的なコンピュータ装置と同様のハードウェア構成によって実現することができる。データ管理装置10,30は、制御部41、主記憶部42、外部記憶部43、操作部44、表示部45および入出力部46を備える。主記憶部42、外部記憶部43、操作部44、表示部45および入出力部46はいずれも内部バス48を介して制御部41に接続されている。
【0057】
制御部41はCPU(Central Processing Unit)等から構成され、外部記憶部43に記憶されている制御プログラム47に従って、前述した各実施形態における辞書作成処理を実行する。
【0058】
主記憶部42はRAM(Random-Access Memory)等から構成され、外部記憶部43に記憶されている制御プログラム47をロードし、制御部41の作業領域として用いられる。
【0059】
外部記憶部43は、フラッシュメモリ、ハードディスク、DVD−RAM(Digital Versatile Disc Random-Access Memory)、DVD−RW(Digital Versatile Disc ReWritable)等の不揮発性メモリから構成され、上述の処理を制御部41に行わせるための制御プログラム47を予め記憶する。また、外部記憶部43は、制御部41の指示に従って、この制御プログラム47が記憶するデータを制御部41に供給し、制御部41から供給されたデータを記憶する。また、外部記憶部43は、上述した各実施形態における登録票記憶部14、類似判定項目記憶部15、判定用データ一時記憶部16、および、受信データ一時記憶部32を物理的に実現する。
【0060】
操作部44はキーボードおよびマウスなどのポインティングデバイス等と、キーボードおよびポインティングデバイス等を内部バス48に接続するインターフェース装置等から構成されている。例えば、操作部44を介して、類似判定項目の変更の指示が制御部41に供給される。
【0061】
表示部45は、CRT(Cathode Ray Tube)またはLCD(Liquid Crystal Display)などから構成され、種々の情報を表示する。
【0062】
入出力部46は、無線送受信機、無線モデムまたは網終端装置、およびそれらと接続するシリアルインタフェースまたはLAN(Local Area Network)インタフェース等から構成されている。例えば、入出力部46は、端末装置20からのデータを受信する。
【0063】
図1、および図11に示すデータ管理装置10,30のデータ受付部11、データ登録部12、類似データ判定部13、および、データ保存部31の処理は、制御プログラム47が、制御部41、主記憶部42、外部記憶部43、操作部44、表示部45および入出力部46などを資源として用いて処理することによって実現される。
【0064】
なお、前記のハードウエェア構成やフローチャートは一例であり、任意に変更および修正が可能である。
【0065】
また、制御部41、主記憶部42、外部記憶部43、操作部44、表示部45、入出力部46および内部バス48などから構成されるデータ管理装置10,30の処理を行う中心となる部分は、専用のシステムによらず、通常のコンピュータシステムを用いて実現可能である。たとえば、前記の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体(フレキシブルディスク、CD−ROM、DVD−ROM等)に格納して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、前記の処理を実行するデータ管理装置10,30を構成してもよい。また、インターネット等の通信ネットワーク上のサーバ装置が有する記憶装置に当該コンピュータプログラムを格納しておき、通常のコンピュータシステムがダウンロード等することでデータ管理装置10,30を構成してもよい。
【0066】
また、データ管理装置10,30の機能を、OS(Operation System)とアプリケーションプログラムの分担、またはOSとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。
【0067】
また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。たとえば、通信ネットワーク上の掲示板(BBS:Bulletin Board System)に前記コンピュータプログラムを掲示し、ネットワークを介して前記コンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、OSの制御下で、他のアプリケーションプログラムと同様に実行することにより、前記の処理を実行できるように構成してもよい。
【0068】
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
【0069】
(付記1)複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたデータ管理装置であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段と、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段と、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段と、を備え、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ管理装置。
【0070】
(付記2)前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データを一時的に記憶する手段をさらに備え、
前記第3判別手段は、類似判定項目の値が新規データと一致するデータが登録票に登録されていない場合、又は、類似判定項目の値が新規データと一致するデータが登録票に登録されており、該データが一時的に記憶したデータ内に含まれている場合に、登録票に登録されているデータのなかに新規データと類似するデータがあると判別する、
ことを特徴とする付記1に記載のデータ管理装置。
【0071】
(付記3)類似判定項目の変更の指示を受け付け、受け付けた変更の指示に基づいて類似判定項目を変更する類似判定項目変更手段をさらに備える、
ことを特徴とする付記1又は2に記載のデータ管理装置。
【0072】
(付記4)複数の項目から構成される新規データを受け付け、受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録ステップを備えたデータ登録方法であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、複数の項目から構成されるデータが登録されている登録票に登録されているか否かを判別する第1判別ステップと、
前記第1判別ステップにより類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別ステップと、
前記第2判別ステップにより類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別ステップと、を備え、
前記登録ステップは、前記第2判別ステップにより類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別ステップにより登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ登録方法。
【0073】
(付記5)複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたコンピュータを、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段、
として機能させることを特徴とするプログラムであって、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするプログラム。
【符号の説明】
【0074】
10 データ管理装置
11 データ受付部
12 データ登録部
13 類似データ判定部
14 登録票記憶部
15 類似判定項目記憶部
16 判定用データ一時記憶部
20 端末装置
N1 ネットワーク
【特許請求の範囲】
【請求項1】
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたデータ管理装置であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段と、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段と、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段と、を備え、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ管理装置。
【請求項2】
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データを一時的に記憶する手段をさらに備え、
前記第3判別手段は、類似判定項目の値が新規データと一致するデータが登録票に登録されていない場合、又は、類似判定項目の値が新規データと一致するデータが登録票に登録されており、該データが一時的に記憶したデータ内に含まれている場合に、登録票に登録されているデータのなかに新規データと類似するデータがあると判別する、
ことを特徴とする請求項1に記載のデータ管理装置。
【請求項3】
類似判定項目の変更の指示を受け付け、受け付けた変更の指示に基づいて類似判定項目を変更する類似判定項目変更手段をさらに備える、
ことを特徴とする請求項1又は2に記載のデータ管理装置。
【請求項4】
複数の項目から構成される新規データを受け付け、受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録ステップを備えたデータ登録方法であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、複数の項目から構成されるデータが登録されている登録票に登録されているか否かを判別する第1判別ステップと、
前記第1判別ステップにより類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別ステップと、
前記第2判別ステップにより類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別ステップと、を備え、
前記登録ステップは、前記第2判別ステップにより類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別ステップにより登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ登録方法。
【請求項5】
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたコンピュータを、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段、
として機能させることを特徴とするプログラムであって、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするプログラム。
【請求項1】
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたデータ管理装置であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段と、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段と、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段と、を備え、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ管理装置。
【請求項2】
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データを一時的に記憶する手段をさらに備え、
前記第3判別手段は、類似判定項目の値が新規データと一致するデータが登録票に登録されていない場合、又は、類似判定項目の値が新規データと一致するデータが登録票に登録されており、該データが一時的に記憶したデータ内に含まれている場合に、登録票に登録されているデータのなかに新規データと類似するデータがあると判別する、
ことを特徴とする請求項1に記載のデータ管理装置。
【請求項3】
類似判定項目の変更の指示を受け付け、受け付けた変更の指示に基づいて類似判定項目を変更する類似判定項目変更手段をさらに備える、
ことを特徴とする請求項1又は2に記載のデータ管理装置。
【請求項4】
複数の項目から構成される新規データを受け付け、受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録ステップを備えたデータ登録方法であって、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、複数の項目から構成されるデータが登録されている登録票に登録されているか否かを判別する第1判別ステップと、
前記第1判別ステップにより類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別ステップと、
前記第2判別ステップにより類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別ステップと、を備え、
前記登録ステップは、前記第2判別ステップにより類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別ステップにより登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするデータ登録方法。
【請求項5】
複数の項目から構成される新規データを受け付けるデータ受付手段と、前記データ受付手段が受け付けた新規データを複数の項目から構成されるデータが登録される登録票に登録する登録手段とを備えたコンピュータを、
類似判定用の項目である類似判定項目の値が新規データと一致するデータが、前記登録票に登録されているか否かを判別する第1判別手段、
前記第1判別手段により類似判定項目の値が新規データと一致するデータが登録票に登録されていると判別された場合に、該データの類似判定項目以外の項目の値が新規データと一致するか否かを判別する第2判別手段、
前記第2判別手段により類似判定項目以外の項目の値が新規データと一致しないと判別された場合に、新規データおよび登録票に登録されているデータの類似判定項目の値に基づいて、登録票に登録されているデータのなかに新規データと類似するデータがあるか否かを判別する第3判別手段、
として機能させることを特徴とするプログラムであって、
前記登録手段は、前記第2判別手段により類似判定項目以外の項目の値が一致すると判別された場合、又は、前記第3判別手段により登録票に登録されているデータのなかに新規データと類似するデータがあると判別された場合に、新規データを前記登録票に登録しない、
ことを特徴とするプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2011−181038(P2011−181038A)
【公開日】平成23年9月15日(2011.9.15)
【国際特許分類】
【出願番号】特願2010−47461(P2010−47461)
【出願日】平成22年3月4日(2010.3.4)
【出願人】(390001395)NECシステムテクノロジー株式会社 (438)
【Fターム(参考)】
【公開日】平成23年9月15日(2011.9.15)
【国際特許分類】
【出願日】平成22年3月4日(2010.3.4)
【出願人】(390001395)NECシステムテクノロジー株式会社 (438)
【Fターム(参考)】
[ Back to top ]