共用データ生成方法、生成装置及び生成プログラム
【課題】生活状況等のプライバシーの秘匿性が高く、且つ、機器の性能評価結果が原需要データを用いた場合の結果と差が小さい仮想的需要データを生成することを可能とする。
【解決手段】対象設備の実際の利用の程度を需要値として計測された原需要データを用途別の需要データに分解する処理(S2)と、用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途の需要データを足し合わせて用途グループ需要値を算出する処理(S3,S4)と、用途グループ毎に用途グループ需要値の中から無作為に抽出したものを足し合わせて仮想的需要データを生成する処理(S5)とを有するようにした。
【解決手段】対象設備の実際の利用の程度を需要値として計測された原需要データを用途別の需要データに分解する処理(S2)と、用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途の需要データを足し合わせて用途グループ需要値を算出する処理(S3,S4)と、用途グループ毎に用途グループ需要値の中から無作為に抽出したものを足し合わせて仮想的需要データを生成する処理(S5)とを有するようにした。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、共用データ生成方法、生成装置及び生成プログラムに関する。さらに詳述すると、本発明は、例えばプライバシー制約があるためにそのままでは共用することができないデータを用いて共用可能な仮想的データを生成する技術に関する。
【0002】
本発明では、種々の設備・機器を利用する,或いはエネルギーを利用・消費する主体の単位(具体的には例えば、個人,世帯,事業者,施設など)のことを需要家という。また、種々の設備・機器の利用の程度,或いはエネルギーの利用・消費の程度を需要量と捉える。また、実際に計測された需要量の実態データのことを原需要データと呼ぶ。また、単位計測時間当たりの需要量の値の経時変化のことを需要曲線と呼ぶ。また、原需要データを複数の者が共用可能なものにするために仮想化した需要データのことを仮想的需要データとも呼ぶ。なお、本発明における原需要データと仮想的需要データとの関係の前提(言い換えると、条件)は、仮想的需要データから読み取れるデータ提供需要家の私生活・事業活動と原需要データから読み取れる私生活・事業活動の実態とが異なる(具体的には、需要曲線が異なる)一方で、仮想的需要データを用いた場合の設備・機器の性能評価結果と原需要データを用いた場合の設備・機器の性能評価結果との差が小さいことである。
【背景技術】
【0003】
民生(即ち、家庭・業務)部門における省エネルギー化を推進するためには、民生部門におけるエネルギー利用の高効率化が重要となっており、エネルギー需要実態に即した機器性能の把握やエネルギー需要の管理が必要とされている。このために民生部門におけるエネルギー需要実態の把握が重要であるところ、個人情報・企業情報保護の意識に根差した需要家の私生活や事業活動を反映するエネルギー需要実態を記録されることへの抵抗感と計測データの漏洩に対する懸念とから、研究機関・企業等の計測実施主体と家庭・事業者等の需要家との間では計測データは非公開とする契約が結ばれることが一般的である。この結果、需要実態データに基づく種々の分析や評価などは独自に計測した限られた数の非公開データに基づくものとならざるを得ない。このため、非公開データを用いて設備・機器の性能評価結果が良かったと主張しても、対象需要家(即ちデータ提供需要家)の特異性に起因する可能性もあり、十分な客観性を持ちづらい。
【0004】
そこで、世帯構成や居住地などの多様な需要実態に即したエネルギー機器やエネルギー管理システムのより一層的確な評価を行うためには、多様・多数の需要家で計測されたエネルギー需要実態データを集積したデータベース(以下、エネルギー需要データベースという)が必要になる。さらに、評価結果の客観性や相互検証可能性を高める上では、当該データベースは公開可能であるか、或いは、少なくとも当該データベースの構築に協力する計測実施主体間では共用可能なものである必要がある。
【0005】
そして、エネルギー需要データベースの構築には、少なくとも、データ提供需要家の私生活や事業活動が需要データからは読み取れないようになっていて需要家が安心して計測に協力できること、及び、共用されるデータはエネルギー機器やエネルギー管理システムの様々な評価において有用であることが要求される。
【0006】
需要家のプライバシーに配慮して原需要データを共用可能な仮想的需要データに変換する従来の共用データ生成方法としては、需要データの対象設備・機器としてヒートポンプ式給湯機を取り上げ、当該給湯機の性能評価で重要となる需要データの代表的計測時刻における需要値,微分値,積算値などの特徴量に着目して仮想的需要データを生成するようにし、原需要データとほぼ同じ特徴量を有し結果的に原需要データ計測日の実際の需要曲線と似た形状の需要曲線を区分多項式関数近似によって原需要データから新たに生成するものがある(非特許文献1)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】佐野・篠原,「プライバシーを保護した需要データ収集・共用方式の開発(その2)- 共用可能な需要データ生成方式 -」,電中研研究報告R08006,電力中央研究所,2009年
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、非特許文献1の共用データ生成方法では、計測間隔が1分から10分程度の短時間間隔の計測データに適用した場合には得られた仮想的需要データの需要曲線が原需要データの需要曲線と変わらないものが生成されるため、また、短時間間隔の仮想的需要データを30分毎に30分間合計の需要データに変換したものでは同時間間隔に変換した原需要データとの差が殆どなくなるため、データ提供需要家のプライバシーの秘匿が十分であるとは言えない。このため、共用が困難であると共に、需要家が計測に協力しなくなる事態も懸念されるという問題がある。
【0009】
そこで、本発明は、計測間隔が短い需要データであっても、生活状況等のプライバシーの秘匿性が高く、且つ、需要データの対象設備・機器の性能評価の結果が原需要データを用いた場合の結果と差が小さい仮想的需要データを生成することができる共用データ生成方法、生成装置及び生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
かかる目的を達成するため、請求項1記載の共用データ生成方法は、設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する処理と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する処理と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する処理とを有するにしている。
【0011】
また、請求項2記載の共用データ生成装置は、設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置と接続された装置であって、記憶装置から原需要データを読み込む手段と、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段とを有するようにしている。
【0012】
また、請求項3記載の共用データ生成プログラムは、設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置にアクセス可能なコンピュータを、記憶装置から原需要データを読み込む手段、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段として機能させるようにしている。
【0013】
したがって、これらの共用データ生成方法、生成装置及び生成プログラムによると、一定期間毎に原需要データを用途別に分解すると共に条件を満たす複数の用途を用途グループとしてまとめて用途グループ需要値を算出し、その上で一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成するようにしているので、原需要データの分解と部分的な統合と異なる期間の合成とが原則として行われる(図13参照)。
【0014】
なお、本発明における設備・機器とは、具体的には例えば一般世帯の給湯機やコンロなどが該当する。また、エネルギーとは、具体的には例えば電気や水やガスなどが該当する。そして、用途としては、具体的には例えば、給湯機の場合には洗顔やシャワーや湯張りなどが想定され、コンロの場合には湯沸かしや炒めや煮込みなどが想定される。また、エネルギーについての用途としては、具体的には例えば、電気については各種の室内外照明使用や種々の冷暖房機使用や種々のOA機器利用などが想定され、水については洗顔や食器洗いや湯張りなどが想定され、ガスについては湯沸かし器の種々の利用やコンロの種々の利用などが想定される。しかしながら、設備・機器やエネルギーの具体例或いは用途の具体例は上述のものに限られるわけではない。なお、以下においては、本発明による仮想的需要データの生成の対象となる設備・機器若しくはエネルギーのことを対象設備という。
【0015】
また、本発明における単位計測時間とは、複数の用途の需要が重複して発生しない(言い換えると、複数の用途の需要が混在しない)程度の時間間隔であり、対象設備によって異なり、一例として挙げれば1分から数分程度の間隔が想定される。また、本発明における一定期間とは、本発明によって生成する仮想的需要データの区切りのことであり、例えば1日や1週間や1月程度の期間が想定される。
【発明の効果】
【0016】
本発明の共用データ生成方法、生成装置及び生成プログラムによれば、原需要データの分解と部分的な統合と異なる期間の合成とが原則として行われるので、データ提供需要家の私生活や事業活動が需要データからは読み取れないようにすることができ、生活状況等のプライバシーの秘匿性の向上を図ることが可能になる。そして、需要データに纏わるプライバシー上の問題を回避して共用がし易くなると共に、需要家が計測に協力し易くなることが期待される。
【図面の簡単な説明】
【0017】
【図1】本発明の共用データ生成方法及び共用データ生成プログラムの実施形態の一例を説明するフローチャートである。
【図2】実施形態の共用データ生成方法をプログラムを用いて実施する場合の共用データ生成装置の機能ブロック図である。
【図3】実施例の原需要データとしての給湯需要量(給湯流量)を表す図であり、5日分を同時表示したものである。
【図4】実施例における各用途の1時間当たりの給湯機利用頻度を表す図である。
【図5】実施例における用途のグループ化を行わない場合の、原需要データと仮想的需要データとの1日の総需要量の分布を示す図である。
【図6】実施例における用途のグループ化を行った場合の、原需要データと仮想的需要データとの1日の総需要量の分布を示す図である。
【図7】実施例の各需要データの需要曲線を示す図である。(A)は原需要データの需要曲線を示す図である。(B)は従来の共用データ生成方法によって生成した仮想的需要データの需要曲線を示す図である。(C)は本発明の共用データ生成方法によって生成した仮想的需要データの需要曲線を示す図である。
【図8】原需要データと仮想的需要データとの各時刻におけるデータ特性を説明する図である。(A)は原需要データの各時刻における給湯需要量の平均を示す図である。(B)は仮想的需要データの各時刻における給湯需要量の平均を示す図である。(C)は両データの各時刻における給湯需要量の平均の差を示す図である。
【図9】原需要データと仮想的需要データとの各時刻におけるデータ特性を説明する図である。(A)は原需要データの各時刻における給湯需要量の分散を示す図である。(B)は仮想的需要データの各時刻における給湯需要量の分散を示す図である。(C)は両データの各時刻における給湯需要量の分散の差を示す図である。
【図10】(A)は原需要データの各時刻における給湯需要量の平均を示す図である。(B)は原需要データと仮想的需要データとの各時刻における給湯需要量の標準偏差を示す図である。
【図11】同じ日における原需要データと仮想的需要データとの1日の総需要量の比較散布を示す図である。
【図12】原需要データを用いた場合と仮想的需要データ(10セット)を用いた場合との年間給湯運転コストの差を示す図である。
【図13】本発明の共用データ生成方法における仮想的需要データの生成の流れを説明する図である。
【発明を実施するための形態】
【0018】
以下、本発明の構成を図面に示す実施の形態の一例に基づいて詳細に説明する。
【0019】
図1及び図2に、本発明の共用データ生成方法、生成装置及び生成プログラムの実施形態の一例を示す。
【0020】
本発明では、仮想的需要データを生成するための原需要データとして、任意の設備・機器の利用の程度やエネルギーの利用・消費の程度を需要量と捉えた、例えば1分から数分程度の所定の間隔を単位計測時間として計測された前記所定間隔中合計(言い換えると、単位計測時間当たり)の需要量である需要実態データを用いる。
【0021】
はじめに、本発明の説明で用いる用語及び記号を以下に整理する。なお、本実施形態では、生成する仮想的需要データの時間的な区切りであって経時的・連続的に行われる計測の区切りである一定期間を1日(0時〜24時)とし、需要実態データの計測日数(欠測日を除く)をN日、1日あたりの計測回数をT回とする。なお、前述のことは言い換えると、単位計測時間当たりで計測されたT個のデータからなる一定期間(1日)毎の需要実態データがN組ある、ということになる。
【0022】
1)需要値yd,t
日付dの0時からt番目(ただし、t=1,2,…,T)に計測された需要量の値を表す。
【0023】
2)用途需要値yud,t
計測対象の需要家における需要データの対象設備の利用用途の総数をUとして、日付dの0時からt番目に計測された用途u(ただし、u=1,2,…,U)の需要量の値を表す。
【0024】
そして、需要値yd,tは、日付d及び計測順番tにおける全ての用途需要値yud,tの総和であり、数式1が成り立つ。
【数1】
【0025】
3)用途グループg
需要曲線の需要値が互いに関連して変動する複数の用途uを一つのグループにまとめたものである。用途グループgに属する用途uの集合を数式2の通りに表記する(文章中では、数式2を{ug1,…,uggn}と表記する;添字gnは用途グループgに属する用途の数を表す)。全ての用途uはいずれかの用途グループgに属する。つまり、用途グループgの総数をG(≦U)として、G個の用途グループは、U個の用途をG個にまとめたものとして形成されるものである。
【数2】
【0026】
4)用途グループ需要値ygd,t
日付dのt番目に計測された用途グループgの需要量の値を表す。用途グループg={ug1,…,uggn}の日付d及び計測順番tにおける需要値ygd,tは、当該用途グループgに属する用途uの用途需要値yud,tの総和であり、数式3が成り立つ。
【数3】
【0027】
また、日付d及び計測順番tにおける需要値yd,tと用途グループ需要値ygd,tとの間には数式4の関係が成り立つ。
【数4】
【0028】
5)1日の、総需要量ytotal,d,用途の総需要量yutotal,d,用途グループの総需要量ygtotal,d
1日の総需要量ytotal,dは日付dに計測された総需要量を表し、数式5が成り立つ。また、日付dに計測された用途uの総需要量yutotal,d及び用途グループgの総需要量ygtotal,dについても数式5と同様の式が成り立つ。
【数5】
【0029】
6)需要曲線vecyd
日付dの0時〜24時の需要値の経時変化をまとめてベクトル表記したものであり(文章中では、ベクトルyをvecyと表記する)、vecyd=(yd,1,…,yd,T)である。また、日付dの0時〜24時の、用途uの需要値の経時変化である用途需要曲線vecyud=(yud,1,…,yud,T)、用途グループgの需要値の経時変化である用途グループ需要曲線vecygd=(ygd,1,…,ygd,T)も同様に表記する。
【0030】
7)需要曲線vecyの多次元分布F^(vecy)
多次元分布F^(vecy)(本来の表記は数式6−1)は、N日分の需要曲線vecyから構成されるT次元分布である。また、N日分の、用途uの用途需要曲線vecyuのT次元分布をF^u(vecyu)(本来の表記は数式6−2)と表記し、用途グループgの用途グループ需要曲線vecygのT次元分布をF^g(vecyg)(本来の表記は数式6−3)と表記する。
【数6】
【0031】
なお、特定の日付dであることを問題としない場合には、上記の各記号において添字dを省略して表記する場合がある。また、原需要データと仮想的需要データとを区別するため、仮想的需要データの値の右肩に“*”を付ける。
【0032】
続いて、本発明の共用データ生成方法における仮想的需要データの生成原理を説明する。
【0033】
本発明において対象とする需要データは、N日分の、例えば1分から数分程度の所定の間隔で計測された計測間隔中合計の対象設備の需要量を表すデータである。そして、収集された需要曲線vecyの分布であるF^(vecy)はN日分のデータから構成されたものであり、計測対象の需要家で計測される需要曲線の真の多次元分布F(vecy)とは異なる。しかし、F(vecy)は未知であり、原需要データの代替となる共用可能な仮想的需要データを生成することを目的とするため、生成された日付dの仮想的需要データの需要曲線vecy*dがF^(vecy)からの標本であることを示すことによって、vecy*dが対象需要家の需要データであるとする。
【0034】
例えば数十分間隔(当該間隔中合計)で計測された対象設備の需要データの需要量は、複数の用途による対象設備の需要量の総量となっている場合が多く、用途との関係が反映されにくい。しかし、1分から数分程度の短い間隔(当該間隔中合計)で計測された対象設備の需要データは、用途と需要値との関係が明瞭に見られる場合が殆どである。そして、当該関係が明瞭であることが設備・機器性能評価や分析における対象設備需要データの有用性に貢献すると考えられる。このため、生成される仮想的需要データにおいて、当該仮想的需要データを設備・機器性能評価や分析に用いることを想定し、用途と需要値との関係が保存されるようにする。
【0035】
そこで、本発明では、「1回の設備利用」を需要値がゼロから正の値になった計測時刻から再びゼロになる一つ前の計測時刻までの設備利用とすると共に、「1回の設備利用」内の各時刻における需要値は或る単一の用途の利用によるものであるとする。そして、「1回の設備利用」を単位として仮想的需要データを生成する。
【0036】
具体的には、まず、収集されたN日分の原需要データを「1回の設備利用」単位で用途別に分解し、N日分の用途uの需要曲線vecyuから得られる用途uの多次元分布をF^u(vecyu)(ただし、u=1,2,…,U)とする。
【0037】
用途uの多次元分布F^u(vecyu)から無作為に抽出した或る1日の用途需要曲線をvecyu*として、全ての用途について需要曲線(vecy1*,…,vecyU*)を抽出し、仮想化した需要曲線vecy*を前記数式1を用いて生成する。
【0038】
同様にしてN日分の仮想化した需要曲線を生成すると、vecyu*がF^u(vecyu)からの無作為抽出であるため、N日分のvecyu*の多次元分布はF^u(vecyu)に一致する。ここで、日付dの需要曲線vecydは、各用途の用途需要曲線vecyud(ただし、u=1,2,…,U)を全ての用途について足し合わせた総需要量として表される。
【0039】
通常は、原需要データの需要曲線vecyから得られる多次元分布F^(vecy)は、単純に用途需要曲線vecyuの多次元分布F^u(vecyu)の和で表すことはできない(すなわち、F^(vecy)≠F^1(vecy1)+F^2(vecy2)+…+F^U(vecyU)である)。このため、F^u(vecyu)とF^u*(vecyu*)とは一致するが、F^(vecy)とF^(vecy*)とは一致しない。したがって、この過程で生成された仮想的需要データは、原需要データの需要曲線から得られる多次元分布と異なるため、原需要データの代替にはなり得ない。
【0040】
F^(vecy)とF^(vecy*)とを一致させるためには、用途u=1,2,…,Uにおいて用途需要曲線vecyuの需要値が互いに関連して変動する用途間の関係が仮想的需要データにおいても同じになっている必要がある。ここで、時間的に連続して使用される用途間では1日の需要値の変動に互いに関連がある。本発明では、原需要データが有する用途間の関連関係を仮想的需要データにおいても保存するようにする。
【0041】
用途間の関連関係が保存されるためには、具体的には、1日の総需要量の分布が原需要データと仮想的需要データとで同じになる必要がある。そこで、1日の総需要量の分布が原需要データと仮想的需要データとで等しくなるように、需要値が互いに関連して変動する用途を一つのグループ(即ち、用途グループ)にまとめる。
【0042】
本発明では、異なる計測日の用途グループ需要曲線をどの計測日のものに変えても1日の総需要量の分布が原需要データと仮想的需要データとで同じになるようにするため、用途グループ間では用途グループ需要曲線の需要値が互いに関連して変動しないように用途グループを構成する。
【0043】
なお、用途グループを構成した後、用途グループ相互間の独立性の検定を行い、用途グループ間で関連性がないことを確認することが好ましい(言い換えると、独立性の検定を行うことは本発明の必須要件ではない)。独立性の検定の方法は特定の方法に限られるものではなく、例えばピアソンによる独立性の検定(例えば、岡本・鈴木・杉山,「基本統計学」,実教出版株式会社,1977年)を用いることが考えられる。
【0044】
そして、原需要データvecyの需要曲線の需要値が用途グループ間で互いに無関係に変動するようにすることにより、言い換えると、そのように用途グループを構成することにより、原需要データの需要曲線から得られる多次元分布F^(vecy)は各用途グループ需要曲線から得られる多次元分布の和で表すことができる(すなわち、F^(vecy)=F^1(vecy1)+F^2(vecy2)+…+F^G(vecyG)である)。
【0045】
F^g(vecyg)とF^g*(vecyg*)とは一致し、仮想的需要データの需要曲線vecy*から得られる多次元分布F^*(vecy*)はF^(vecy)と一致する。このことにより、生成された仮想的需要データの需要曲線vecy*は、原需要データから得られる需要曲線の分布と同じ分布からの抽出であるとみなせる。このため、vecy*は原需要データからの標本であるとし、仮想的需要データは原需要データの代替として用いることができる。
【0046】
この操作では、仮想化した需要曲線を生成する対象日における用途グループ需要曲線を異なる計測日の用途グループ需要曲線vecyg*と入れ替えることによって、vecygの需要値をvecygの多次元分布F^g(vecyg)に従ってvecyg*の需要値へ時刻方向にずらしたものとみなせる。また、vecyg*に入れ替えることによってvecygにはない需要が新たに発生した場合や、或いは、vecygにあった需要がvecyg*では消失している場合には、F^g(vecyg)に従って需要が発生或いは消失したものとみなせる。
【0047】
異なる日の各用途グループ需要曲線を組み合わせて生成される仮想的需要データについて、需要データの対象設備によっては、例えば季節がまったく異なるなどのように対象設備の需要に変化を与える外的要因が異なる用途グループ需要曲線が組み合わされた場合には対象需要家において実際に計測されるとは考えにくい。そこで、原需要データの特性を調べ、対象設備の需要に変化を与える外的要因の変化(気候や生活パターンの変化など)が小さい期間において同じ用途グループの異なる日に計測された需要曲線と組み合わせる。なお、平日は不在であり、在宅は土日のみであるなど、曜日によって1日の需要が異なる需要家に対しては、平日同士または土日同士での用途グループ需要曲線の組み合わせに限定することも有効である。
【0048】
そして、上述の原理に基づいて仮想的需要データを生成するため、本発明の共用データ生成方法は、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する処理(S2)と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する処理(S3,S4)と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する処理(S5)とを有するようにしている。なお、本実施形態では、上記一定期間を1日としている。
【0049】
また、上記共用データ生成方法は、本発明の共用データ生成装置として実現され得る。この共用データ生成装置は、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置と接続された装置であって、記憶装置から原需要データを読み込む手段と、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段とを備えている。なお、本実施形態では、上記一定期間を1日としている。
【0050】
上述の共用データ生成方法及び共用データ生成装置は、本発明の共用データ生成プログラムをコンピュータ上で実行することによっても実現される。本実施形態では、共用データ生成プログラムをコンピュータ上で実行する場合を例に挙げて説明する。
【0051】
共用データ生成プログラム17を実行するためのコンピュータ10(即ち共用データ生成装置10)の全体構成を図2に示す。この共用データ生成装置10は、制御部11、記憶部12、入力部13、表示部14及びメモリ15を備え相互にバス等の信号回線により接続されている。また、共用データ生成装置10にはデータサーバ16がバス等の信号回線により接続されており、その信号回線を介して相互にデータや制御指令等の信号の送受信(即ち入出力)が行われる。
【0052】
本実施形態では、例えば一年から数年程度の期間に亘って計測対象の需要家において日付dの0時からt番目に計測された需要値yd,t(即ち、原需要データ)が、原需要データベース18としてデータサーバ16に蓄積される。
【0053】
制御部11は記憶部12に記憶されている共用データ生成プログラム17によって共用データ生成装置10全体の制御並びに共用データとしての仮想的需要データの生成等に係る演算を行うものであり、例えばCPU(中央演算処理装置)である。
【0054】
記憶部12は少なくともデータやプログラムを記憶可能な装置であり、例えばハードディスクである。
【0055】
メモリ15は制御部11が種々の制御や演算を実行する際の作業領域であるメモリ空間となるものであり、例えばRAM(Random Access Memory の略)である。
【0056】
入力部13は少なくとも作業者の命令を制御部11に与えるためのインターフェイスであり、例えばキーボードである。
【0057】
表示部14は制御部11の制御により文字や図形等の描画・表示を行うものであり、例えばディスプレイである。
【0058】
そして、共用データ生成プログラム17を実行することにより、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置としてのデータサーバ16にアクセス可能なコンピュータである共用データ生成装置10の制御部11には、データサーバ16から原需要データを読み込む手段としての原需要データ読込部11a、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段としての用途分解部11b、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段(仮想化需要曲線生成部11c,分布比較部11d,用途グループ構成部11e)、用途グループ毎に一定期間の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段としての仮想的需要データ生成部11fが構成される。なお、本実施形態では、上記一定期間を1日としている。
【0059】
本実施形態の共用データ生成方法の実行にあたっては、まず、制御部11の原需要データ読込部11aが、計測対象の需要家において計測され収集されたN日分の原需要データをデータサーバ16から読み込む(S1)。
【0060】
具体的には、本実施形態では、原需要データ読込部11aが、原需要データベース18として蓄積されている需要値yd,tをデータサーバ16から読み込む。そして、原需要データ読込部11aは、読み込んだ需要値yd,tをメモリ15に記憶させる。
【0061】
次に、制御部11の用途分解部11bが、原需要データを用途別に分解する(S2)。なお、仮想的需要データ生成の対象需要家が複数あり、S1の処理において複数の需要家の原需要データ(需要値yd,t)をまとめて読み込んだ場合には、S2以降の処理は需要家毎に行う。
【0062】
用途分解部11bは、本実施形態では、原需要データの収集対象設備であって仮想的需要データの生成対象設備について想定される用途別に、クラスタリングを行うことによって原需要データを分解する。
【0063】
原需要データを用途別に分解するために行うクラスタリングは、データをクラスに分類することができる方法であればどのような方法を用いても良い。具体的には例えば、データからクラス数及び各クラスに属するデータの平均値を自動的に決定する方法の一つであるX-means法を用いることが考えられる。
【0064】
X-means法は、K-means法によってデータをクラスに分類して各クラスに属するデータの平均値を求め、更に、クラス数をベイズ型情報量基準(BICとも呼ばれる)に基づいて自動的に決定するものである。なお、X-means法やK-means法やベイズ型情報量基準自体は周知の技術であるのでここでは詳細については省略する(例えば、Dan Pelleg and Andrew Moore,“Accelerating exact k-means algorithms with geometric reasoning”,International Conference on Knowledge Discovery and Data Mining,pp.277-281,1999年;C. M. Bishop著,元田・栗田・樋口・松本・村田監訳,「パターン認識と機会学習 下」,シュプリンガー・ジャパン,2008年;小西・北川,「予測と発見の科学 情報量基準」,朝倉書店,2004年 を参照)。
【0065】
X-means法を原需要データに適用することにより、計測対象の需要家で計測された原需要データの総用途数Uが決定され、「1回の設備利用」の用途分解が行われる。
【0066】
具体的には、ほぼ同一の需要量を有する設備利用は同一の用途の設備利用であると推定する。ただし、対象設備の種類によっては継続時間の長い利用での需要量の方が安定する場合もあり、用途別の需要量の代表値(即ち平均値)としてより一層適切な場合がある。このため、継続時間を考慮しながら、適切な総用途数U及び各用途の代表的需要量μkをK-means法とベイズ情報量基準とを用いて推定する。
【0067】
本発明では、原需要データで需要量がゼロでなくなり(即ち、需要が発生し)再びゼロになる(即ち、需要が終了する)直前までを「設備利用」の単位とし、これら「設備利用」を分析することによって総用途数Uと各用途uの平均需要量μuとを推定する。ここで、「設備利用」の分析では、計測期間中の継続時間s以上の設備利用を対象とする。このような設備利用の発生回数をNs回と表記する。
【0068】
K-means法では、用途uの需要量は平均μu,分散σ2(用途によらず同一)の正規分布に従うと仮定する。このとき、各設備利用iが属する用途をu(i)とすると共に各設備利用の需要量をyiとすると、用途uの平均需要量の最尤推定値μ^u(本来の表記は数式7−1)は用途uに属するnu個の設備利用の需要量の平均となり、分散の最尤推定値σ^2(本来の表記は数式7−2)は設備利用iの需要量yiと属する用途u(i)の平均需要量μ^uとの差の2乗平均となる(数式8)。
【数7】
【数8】
【0069】
そして、K-means法では、分散の最尤推定値σ^2が最小となるように各設備利用が属する用途を決定する。
【0070】
なお、用途分類を行う上での最適な総用途数Uは、数式9に示すベイズ情報量基準(BIC)が最小になるように決定する。
【数9】
【0071】
ただし、継続時間sを変更するとベイズ情報量基準による最適な用途数Uは変化する。継続時間sが大きいほど対象となる設備利用数Nsは少なく、また、用途の単位計測時間当たりの需要量の代表性が高くなる。そこで、大きな継続時間sで得られた用途を大きくは変えないようにしながら継続時間sを順次小さくしていき、最適な用途数U及びその期待値μ^uを決定する。具体的には以下の手順で行う。
【0072】
〈ステップ1〉
継続時間sをsstartからΔsずつ増やしていき、最適とみなされる用途数が1又は継続時間s=sendとなった時点を開始継続時間s=smaxとする。この時得られた最適な用途数をUsmax,各用途の平均需要量の最尤推定値をμ^uとする。なお、sstart,Δs,sendはいずれも、特定の値に限られるものではなく、対象設備の種類・特性や原需要データにおける利用実態などを考慮して適切な値に設定される。具体的には例えば、sstartは5分程度,Δsは1分程度,sendは10分程度とすることが考えられる。
【0073】
〈ステップ2〉
継続時間s=s−Δsとする。この時、既に得られているUs+1個の用途の最尤推定値μ^uは固定し、未知の平均μを持つ新たな用途(Us+1+1)を追加した時にBICが改善するか否かを調べる。改善する場合は、新たな用途を更に追加して継続時間sでの最適な用途数Usを求める。
【0074】
〈ステップ3〉
最適な用途数が増加しない(即ち、Us=Us+1)場合は終了する。
【0075】
〈ステップ4〉
最適な用途数Usが増加した場合は、K-means法によってUs個の全用途の最適なμ^uを推定し直し、ステップ2に戻る。
【0076】
本実施形態では、用途分解部11bが、S1の処理においてメモリ15に記憶された(或る需要家の)原需要データの需要値yd,tをメモリ15から読み込み、「1回の設備利用」を抽出する。具体的には、日付d,計測順番t(これは単位計測時間,計測時刻としての情報も有する),「1回の設備利用」毎の識別子(例えば1からの連番),需要値がゼロから正の値になりその後にゼロになるまでの需要値yd,tの組み合わせデータの集合を「1回の設備利用」データとしてメモリ15に記憶させる。なお、需要値がゼロから正の値になりその後にゼロになるまでが「1回の設備利用」であり、同じ識別子が付与される。
【0077】
用途分解部11bは、さらに、上述のように、「1回の設備利用」各々について需要値が同じであれば用途が同じであると判断することにより、需要値yd,tを用いてクラスタリングを行って原需要データを用途別に分解する。
【0078】
そして、用途分解部11bは、原需要データの需要値yd,tの各々に用途uを追加してメモリ15に記憶させる。
【0079】
次に、用途グループの検討(S3)として、制御部11の仮想化需要曲線生成部11cが、仮想化した需要曲線を生成する(S3−1)。
【0080】
N日分の原需要データと仮想化した需要データとのそれぞれから得られる1日の総需要量(即ち、ytotalとy*total)の分布の差が小さくなることを条件として、需要曲線の需要値が互いに関連して変動する用途を一つのグループにまとめる。
【0081】
具体的には、考えられる全ての用途の組み合わせで用途をグループにまとめて仮の用途グループの組み合わせを構成する。そして、当該仮の用途グループの組み合わせ毎に数式3を用いて用途グループ需要値ygd,tを算出してN日分の用途グループ需要曲線vecygdを生成する。
【0082】
そして、仮の用途グループ毎のN日分の用途グループ需要曲線vecygd=(ygd,1,…,ygd,T)から無作為に1日分の用途グループ需要曲線vecyg*を抽出し、数式4を用いて1日分の仮想化した需要曲線vecy*を生成する。同様に、1日分の用途グループ需要曲線vecyg*を抽出する際の乱数を様々に変えて仮の用途グループの組み合わせ毎にN日分の仮想化した需要曲線vecy*をXセットずつ生成する。なお、本処理における用途グループ需要曲線の抽出では、特定の用途グループ需要曲線が複数回抽出されることがあり得る一方で、全く抽出されない用途グループ需要曲線もあり得る。
【0083】
上述の手順により、考えられる全ての用途の組み合わせとして構成された仮の用途グループの組み合わせの全てについてN日分の仮想化した需要曲線をXセットずつ生成する。なお、需要曲線のセット数Xの値は、特定の値に限られるものではなく、続くS3−2の処理及びS4の処理も踏まえて適切な値に設定される。具体的には例えば数十から数百程度の範囲に設定することが考えられる。また、需要曲線のセット数Xの値は共用データ生成プログラム17に予め規定されるようにしても良いし、当該S3−1の処理の段階で入力部13を介して指定・変更されるようにしても良い。
【0084】
本実施形態では、仮想化需要曲線生成部11cが、S2の処理において用途uが追加されてメモリ15に記憶された原需要データの需要値yud,tをメモリ15から読み込み、上述の手順によって仮の用途グループの組み合わせ毎にN日分の用途グループ需要曲線vecygdを生成すると共に仮想化した需要曲線vecy*をXセットずつ生成する。
【0085】
そして、仮想化需要曲線生成部11cは、仮の用途グループの組み合わせ毎に、N日分の用途グループ需要曲線vecygd(即ち、用途グループ需要値ygd,t)、並びに、XセットのN日分の仮想化した需要曲線vecy*の需要値y*d,tをメモリ15に記憶させる。
【0086】
次に、制御部11の分布比較部11dが、原需要データと仮想化した需要データとの総需要量の分布を比較する(S3−2)。
【0087】
このS3−2の処理における総需要量は、経時的・連続的に行われる計測の単位(言い換えると、区切り)である一定期間毎の総需要量のことである。本実施形態では、一定期間を1日(0時〜24時)としているので、1日の総需要量の分布を比較する。
【0088】
原需要データに基づく1日の総需要量ytotal,dは、原需要データの需要値yd,tと数式5とを用いて算出される。また、仮想化した需要データに基づく1日の総需要量y*total,dは、S3−1の処理において生成された仮想化した需要曲線vecy*の需要値y*d,tと数式5とを用いて算出される。なお、S3−1の処理を受け、仮想化した需要データに基づく1日の総需要量は、仮の用途グループの組み合わせそれぞれについてN日分の1日総需要量がXセット算出される。
【0089】
そして、原需要データに基づく1日の総需要量のN日分の分布と仮想化した需要データに基づく1日の総需要量のN日分の分布とが等しいか否かを検定する。二つの分布が等しいか否かの検定は、二つのデータセットの分布が等しいか否かを検定することができる方法であればどのような方法を用いても良い。具体的には例えばコルモゴルフ・スミルノフ検定(KS検定とも呼ばれる;例えば、岡本・鈴木・杉山,「基本統計学」,実教出版株式会社,1977年)を用いることが考えられる。なお、本実施形態では、二つのデータセットの分布が等しいか否かの検定に纏わる処理が共用データ生成プログラム17に組み込まれる。
【0090】
本実施形態では、分布比較部11dが、S1の処理においてメモリ15に記憶された原需要データの需要値yd,tをメモリ15から読み込んで1日の総需要量ytotal,d(N日分)を算出すると共に、S3−1の処理においてメモリ15に記憶された仮想化した需要曲線の需要値y*d,tをメモリ15から読み込んで1日の総需要量y*total,d(仮の用途グループの組み合わせそれぞれについてN日分をXセット)を算出する。
【0091】
さらに、分布比較部11dは、例えばKS検定を用いて原需要データの1日の総需要量ytotal,dのN日分の分布と仮想化した需要曲線の1日の総需要量y*total,dのN日分の分布とが等しいか否かを、仮の用途グループの組み合わせそれぞれについてのXセット毎に検定する。なお、分布の検定は、一つの原需要データの分布と、仮の用途グループの組み合わせ毎のXセットの仮想化した需要データの分布のそれぞれとについて行われる。
【0092】
そして、分布比較部11dは、仮の用途グループの組み合わせ毎に、Xセットの仮想化した需要データの分布のそれぞれについて、原需要データの分布と等しいか否かをメモリ15に記憶させる。
【0093】
次に、制御部11の用途グループ構成部11eが、仮想化した需要データを生成する用途グループを構成する(S4)。
【0094】
S3−2の処理によって原需要データから得られる1日の総需要量のN日分の分布と有意な差がないとみなされた仮想化した需要データがXtセット(以下、判定セット数Xt)以上になっている仮の用途グループの組み合わせのうち、秘匿性を担保するため、用途グループ数が最も多くなっている用途の組み合わせを、仮想化した需要データを生成する用途グループとして特定する。なお、用途グループ数が多いほど、より多くの異なる一定期間毎の需要データを使用して仮想需要データが生成されるので、生成された仮想需要データは原需要データとは異なるものが生成されて原需要データそのものの復元が困難になる。また、判定セット数Xtは特定の値に限られるものではなく、需要曲線のセット数Xや元のデータ(ここでは原需要データ)から無作為に抽出して作成されたデータの分布が元のデータの分布と概ね等しくなると期待される水準を考慮して適当に設定される。具体的には例えば、判定セット数Xtは需要曲線のセット数Xの9割程度とすることが考えられる。また、判定セット数Xtの値は共用データ生成プログラム17に予め規定されるようにしても良いし、当該S4の処理の段階で入力部13を介して指定・変更されるようにしても良い。
【0095】
なお、上述の手順によって用途グループ数が同じであるために仮の用途グループの組み合わせが複数特定された場合には、それらのうちで原需要データの分布と有為な差がないと判断された仮想化した需要データのセット数が最も多い仮の用途グループの組み合わせを、仮想化した需要データを生成する用途グループとする。また、一つの用途のみによって一つの用途グループが構成されることもあり得る。
【0096】
本実施形態では、用途グループ構成部11eが、S3−2の処理においてメモリ15に記憶された1日総需要量の分布の等否の検定結果を読み込み、仮の用途グループの組み合わせ毎に、Xセットの仮想化した需要データのうち原需要データの分布と等しいと判断されたセット数をカウントする。
【0097】
さらに、用途グループ構成部11eは、上述でカウントされたセット数が判定セット数Xt以上になっている仮の用途グループの組み合わせを選択すると共に、選択された仮の用途グループの組み合わせのうちで用途グループ数が最も多いものを特定する。複数の仮の用途グループの組み合わせが選択された場合には、それらのうちで原需要データの分布と有為な差がないと判断された仮想化した需要データのセット数が最も多い仮の用途グループの組み合わせを特定する。
【0098】
そして、用途グループ構成部11eは特定された仮の用途グループの組み合わせを仮想化した需要データを生成する用途グループgの組み合わせとして、各用途uと当該用途uの用途グループgとの対応をメモリ15に記憶させる。
【0099】
次に、制御部11の仮想的需要データ生成部11fが、仮想的需要データを生成する(S5)。
【0100】
具体的には、S4の処理において特定された用途グループの組み合わせにおける各用途グループgについての日付dの用途グループ需要曲線vecyg*dを、当該日付dの前後M日の期間内の用途グループ需要曲線の中から無作為に抽出し、数式4を用いて1日分の仮想的需要データy*(即ち、需要値y*d,t)を生成する。無作為に抽出する際の乱数を様々に変えて、N日分の、1日分の仮想的需要データy*を生成する。なお、無作為抽出の期間Mは特定の日数に限られるものではなく、需要に変化を与える外的要因の変化が小さいと考えられる期間を考慮して適切な日数に設定される。また、この期間Mは、対象設備に関しては需要に変化を与える気候や生活パターン等の外的要因がない(言い換えると、例えば季節などによって需要特性に変化がない)などの場合には、設定しなくても良い。
【0101】
本実施形態では、仮想的需要データ生成部11fが、S3−1の処理においてメモリ15に記憶された仮の用途グループの組み合わせ毎のN日分の用途グループ需要曲線vecygd(即ち、用途グループ需要値ygd,t)のうちS4の処理において特定された用途グループの組み合わせについてのN日分の用途グループ需要曲線vecygd(用途グループ需要値ygd,t)をメモリ15から読み込み、これら用途グループ需要曲線vecygd(用途グループ需要値ygd,t)を用いて1日分の仮想的需要データy*(即ち、需要値y*d,t)を生成する。
【0102】
そして、仮想的需要データ生成部11fは、1日分の仮想的需要データy*(需要値y*d,t)を例えばデータサーバ16内に格納される仮想的需要データベース19に蓄積する。
【0103】
そして、制御部11は仮想的需要データの生成処理を終了する(END)。
【0104】
以上のように構成された本発明の共用データ生成方法、生成装置及び生成プログラムによれば、原需要データの分解と部分的な統合と異なる期間の合成とが原則として行われるので、データ提供需要家の私生活や事業活動が需要データからは読み取れないようにすることができ、生活状況等のプライバシーの秘匿性の向上を図ることが可能になる。
【0105】
なお、上述の形態は本発明の好適な形態の一例ではあるがこれに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変形実施可能である。例えば、本実施形態では、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置をデータサーバ16としているが、前記記憶装置はこれに限られず、例えば記憶部12を記憶装置として使うようにしても良いし、制御部11との間で入出力をすることができる外付けの種々の記憶媒体・記憶装置でも良い。
【実施例1】
【0106】
需要データの対象設備をヒートポンプ式給湯機とし、本発明の共用データ生成方法、生成装置及び生成プログラムを、ヒートポンプ式給湯機を利用する需要家における実際の給湯需要データを原需要データとした仮想的需要データの生成に適用した実施例を図3から図12を用いて説明する。
【0107】
本実施例では、或る需要家を対象にヒートポンプ式給湯機における1分間隔で計測された一年分(欠測があったため計測日数N=358)の給湯需要データを原需要データとして用いた。本実施例では、一定期間は1日であり、単位計測時間は1分である。
【0108】
ここで、本実施例における需要データの対象設備であるヒートポンプ式給湯機について説明する。貯湯タンクを持つヒートポンプ式給湯機制御は、例えば早朝に1日分の給湯需要量の多くを貯めておき、湯が不足しそうな時には沸き増しを行う。このとき、早朝に貯める湯量の決定には、1日の総需要量などの需要量の積算値が重要な要素となり、一方、沸き増しを行う貯湯量の決定には湯切れが生じそうな時刻における最大需要量が重要な要素となる。そのため、ヒートポンプ式給湯機の機器性能評価においては、需要データの計測時刻における需要値,微分値,積算値が重要な需要特性となる。
【0109】
そして、原需要データを用途別に分解した(S2)。
【0110】
まず、本実施例の原需要データである給湯需要データの特性を概観するため、或る5日間に計測された給湯流量(単位:L(リットル))を、当該5日分を全て重ねることによって図3に示す結果が得られた。
【0111】
図3から、異なる時刻の給湯利用であるにもかかわらず、単位計測時間当たりの給水流量がほぼ同じである複数の代表的な値があることが確認された。各代表値は、湯張り制御や追い炊き制御に基づく給湯量であり、利用者や用途固有の蛇口の開口度合いなどによるものであると考えられた。
【0112】
ベイズ情報量基準を用いて給湯需要データの用途数を決定すると共に、K-means法によって各用途の平均流量を決定し、原需要データとしての給湯需要データの用途分解を行った。
【0113】
ベイズ情報量基準による用途分解の結果、本実施例で対象とした給湯需要データの用途数は6となった。各用途の平均流量を表1に示す。なお、継続時間sは3分になった。
【表1】
【0114】
本実施例では、また、「1回の給湯機利用」の時間が2分以内である需要値を「短時間利用」とすると共に、いずれの用途にも属しなかった需要値を「その他利用」とし、全用途数Uを8とした。
【0115】
本実施例の給湯需要データの特性を概観するため、また、各用途において1日の0時から24時まで1時間毎に1時間内の給湯機利用頻度を、各時間帯において需要値が0を含まない正の値であった回数として数えることによって図4に示す結果が得られた。
【0116】
図4から、夕方のみに利用頻度が高い用途と、朝と夕方との両方に利用頻度が高い用途とがあることが確認された。
【0117】
次に、用途グループの検討(S3)として、仮想化した需要曲線を生成した(S3−1)。
【0118】
すなわち、原需要データと仮想的需要データとの需要曲線の1日総需要量(即ち、ytotalとy*total)の分布を等しくするために、KS検定によってytotalとy*totalとの分布が等しいか否かを検定し、分布が等しいとみなされた用途を組み合わせることによって用途グループを構成した。
【0119】
具体的には、はじめに、用途をグループにまとめずに8つの用途それぞれについてN日分の用途需要曲線vecyu(u=1,2,…,8)から1日分の需要曲線vecyu*を無作為に抽出し、仮想的需要データを数式1を用いて生成した。
【0120】
次に、原需要データと仮想的需要データとの1日の総需要量の分布を比較した(S3−2)。
【0121】
生成された仮想的需要データの1日の総需要量y*totalを数式5を用いて計算し、総需要量y*totalの分布として図5に示す結果が得られた。図5に示す例では、1日の総需要量の分布は原需要データと仮想的需要データとで異なっている。
【0122】
次に、仮想的需要データを生成する用途グループを構成した(S4)。
【0123】
用途をグループにまとめた結果、8つの用途は4つの用途グループA,B,C,Dにまとめられた。各用途グループに属する用途を表2に示す。
【表2】
【0124】
1日の総需要量の分布が原需要データと仮想的需要データとで同じになるように用途をグループにまとめることにより、1日の総需要量の分布として図6に示す結果が得られた。
【0125】
図6に示す結果から、複数の用途をグループにまとめることにより、用途のまま組み合わせて仮想的需要データを生成した場合に比べ、仮想的需要データの1日の総需要量の分布が原需要データの分布に近いものになることが確認された。
【0126】
また、N日分の用途グループ需要曲線から各用途グループの1日の総需要量ygtotalを計算して用途グループ間の相関係数を算出することによって表3に示す結果が得られた。
【表3】
【0127】
表3に示す結果から、用途グループ間では相関係数がほぼゼロになっていることが確認された。
【0128】
さらに、ピアソンの独立性の検定を行うことにより、用途グループ需要曲線は互いに需要値の変動に関連が無いことが確認された。
【0129】
次に、計測日数N(=358)日分の仮想的需要データを生成する(S5)。
【0130】
本実施例では、気候の変動など給湯需要に変化を与える外的要因の変化が、仮想的需要データを生成する対象日の前後2週間以内(即ち、無作為抽出の期間M=14日)であれば小さいと想定した。そして、データ生成対象日の前後2週間以内の原需要データから無作為に抽出した用途グループ需要曲線を用いて仮想的需要データを生成した。
【0131】
本実施例では、同一日の仮想的需要データと原需要データとの需要曲線が大きく異なったものにならないようにするため、1日の総需要量が最も大きい用途グループAの用途グループ需要曲線は原需要データと仮想的需要データとで同一日とものとした。
【0132】
計測日数N(=358)日分の仮想的需要データを作成し、そのうちの一例として或る1日の仮想的需要データの需要曲線として図7(C)に示す結果が得られた。図7には、当該仮想的需要データと同一日の(言い換えると、データ生成対象日として対応する)原需要データの需要曲線(同図(A))、及び、非特許文献1の共用データ生成方法によって生成した仮想的需要データの需要曲線(同図(B))も示す。
【0133】
図7に示す結果から、非特許文献1の共用データ生成方法によって生成した仮想的需要データの需要曲線(同図(B))は、原需要データの需要曲線(同図(A))と酷似しており、仮想的需要データから読み取れるデータ提供需要家の私生活が原需要データから読み取れるものと変わらず、秘匿性が低いものであることが確認された。
【0134】
一方、本発明の共用データ生成方法によって生成した仮想的需要データの需要曲線(図7(C))は、用途グループA,B,C,Dのそれぞれにおいて異なる日の用途グループ需要曲線が組み合わされて生成されていることが確認された。そして、仮想的需要データから読み取れるデータ提供需要家の私生活が原需要データから読み取れるものとは異なっており(例えば、仮想的需要データ(同図(C))では昼間(大凡11時〜14時)に給湯需要が発生しているが、原需要データ(同図(A))では同時間帯に給湯需要は発生していない)、秘匿性が高いデータが生成されていることが確認された。
【0135】
また、計測日数N日分の原需要データと仮想的需要データとの各時刻における平均及び両データの平均の差を算出して図8に示す結果が得られ(同図(A)は原需要データの平均、同図(B)は仮想的需要データの平均、(C)は両データの平均の差)、両データの各時刻における分散及び両データの分散の差を算出して図9に示す結果が得られた(同図(A)は原需要データの分散、同図(B)は仮想的需要データの分散、(C)は両データの分散の差)。図8及び図9から、原需要データと仮想的需要データとの各時刻における平均の差及び分散の差は0の周辺に分布していて小さく、大きな偏りは見られないことが確認された。
【0136】
また、各計測日時における原需要データの需要値(即ち、給湯需要量)と仮想的需要データの需要値(即ち、給湯需要量)との差異を標準偏差で表すことによって図10に示す結果が得られた(同図(B))。図10では原需要データの1日の各時刻における需要値の平均を併せて示した(同図(A))。
【0137】
図10から、各時刻における標準偏差は原需要データの平均値と同じくらいの差が生じていることが確認された。また、原需要データと仮想的需要データとの各時刻における需要値の平均及び分散はほぼ等しい(図8及び図9参照)のに対し、図10に示すように各時刻における原需要データの需要値と仮想的需要データの需要値との間には差異が明瞭に見られることが確認された。このことから、仮想的需要データは原需要データとは異なるが、計測日数N日分の原需要データと仮想的需要データとの各時刻における需要値の平均及び分散はほぼ等しくなっていることが確認された。
【0138】
また、同じ日付の原需要データと仮想的需要データとの1日の総需要量を比較することによって図11に示す散布図が得られた。図11から、1日の総需要量は原需要データと仮想的需要データとで異なっており、1日の総需要量の面からも仮想的需要データは秘匿性が高いものであることが確認された。
【0139】
続いて、本実施例では、本発明の共用データ生成方法によって生成された仮想的需要データが機器性能評価において有用性を有するものであることを確認するため、ヒートポンプ式給湯機のシミュレーションツールを用い、本発明の共用データ生成方法によって生成された仮想的需要データを用いた場合の性能評価結果と原需要データを用いた場合の性能評価結果とを比較した。
【0140】
本実施例では、定格出力4.5〔KW〕,エネルギー消費効率(仕事率)4.02,タンク容量300〔L〕,1日の放熱率8%のヒートポンプ式給湯機について、原需要データと仮想的需要データ(358日分を1セットとして10セット)との給湯機運転コスト及び湯切れ回数をシミュレーションツールを用いて調べた。なお、本実施例では、給湯機のシミュレーションツールとして、ヒートポンプ式給湯機の最適運転構成選択ツール(所・橋本・篠原,「ヒートポンプ式給湯機最適構成探索ツールの開発」,電中研研究報告R06018,2007年)を10分間隔の需要データにも使用し得ると共に最適な運転ルールを探索するように改良したものを用いた。
【0141】
本実施例では、シミュレーションツールに入力する給湯機需要データとして、比較元としての原需要データ1セットに加え、本発明の共用データ生成方法によって生成された仮想的需要データを10セット用いた。
【0142】
本実施例でのヒートポンプ式給湯機の運転ルールは以下の通りとした。
〈ルール1〉朝7時までに、至近1週間の7時から[h1]時間の総需要の最大値の[c1]倍を蓄熱する。
〈ルール2〉夕方17時に、至近1週間の17時から[h2]時間の総需要の最大値の[c2]倍を蓄熱する。
〈ルール3〉残湯量が[x1]kcalを下回ったら[x2]kcalになるまで沸き増す。
【0143】
上記運転ルールの各パラメータ(具体的には、h1,c1,h2,c2,x1,x2)は、原需要データと仮想的需要データ(第1セット)との各々で湯切れが生じず、各需要データの年間給湯運転コストの総和が最小になるように最適化したものを用いた。
【0144】
最適化の結果、原需要データを用いた場合の年間給湯運転コストは1万5千円であった。そして、本発明の共用データ生成方法によって生成された仮想的需要データ(10セット)それぞれを用いた場合の年間給湯機運転コストと原需要データを用いた場合の年間給湯機運転コストとの差を算出して図12に示す結果が得られた。
【0145】
図12から、運転コストの差の最大値は140円であり、原需要データを用い場合の年間給湯機運転コスト(=1万5千円)の1%以内であるので、本発明の共用データ生成方法によって生成された仮想的需要データは設備・機器性能評価に用いる上で支障がないことが確認された。
【0146】
仮想的需要データ(10セット)それぞれの年間給湯機運転コストの原需要データの場合との差の平均は6円であり、図12にも現れているように仮想的需要データそれぞれの原需要データの場合とのコスト差は正と負との両方の値をとり、偏りは小さいことが確認された。
【0147】
また、原需要データの場合とのコスト差が正と負との両方の値をとることから、図12に見られる給湯機運転コストの差は、対象需要家における給湯需要用途の発生時刻の違いなどにより生じる年間給湯機運転コストの揺らぎを反映していると考えられた。そして、このことから、本発明の共用データ生成方法によって生成された複数セットの仮想的需要データは、需要変動の影響を評価するためのデータとしても有効なデータになると考えられた。
【符号の説明】
【0148】
10 共用データ生成装置
17 共用データ生成プログラム
【技術分野】
【0001】
本発明は、共用データ生成方法、生成装置及び生成プログラムに関する。さらに詳述すると、本発明は、例えばプライバシー制約があるためにそのままでは共用することができないデータを用いて共用可能な仮想的データを生成する技術に関する。
【0002】
本発明では、種々の設備・機器を利用する,或いはエネルギーを利用・消費する主体の単位(具体的には例えば、個人,世帯,事業者,施設など)のことを需要家という。また、種々の設備・機器の利用の程度,或いはエネルギーの利用・消費の程度を需要量と捉える。また、実際に計測された需要量の実態データのことを原需要データと呼ぶ。また、単位計測時間当たりの需要量の値の経時変化のことを需要曲線と呼ぶ。また、原需要データを複数の者が共用可能なものにするために仮想化した需要データのことを仮想的需要データとも呼ぶ。なお、本発明における原需要データと仮想的需要データとの関係の前提(言い換えると、条件)は、仮想的需要データから読み取れるデータ提供需要家の私生活・事業活動と原需要データから読み取れる私生活・事業活動の実態とが異なる(具体的には、需要曲線が異なる)一方で、仮想的需要データを用いた場合の設備・機器の性能評価結果と原需要データを用いた場合の設備・機器の性能評価結果との差が小さいことである。
【背景技術】
【0003】
民生(即ち、家庭・業務)部門における省エネルギー化を推進するためには、民生部門におけるエネルギー利用の高効率化が重要となっており、エネルギー需要実態に即した機器性能の把握やエネルギー需要の管理が必要とされている。このために民生部門におけるエネルギー需要実態の把握が重要であるところ、個人情報・企業情報保護の意識に根差した需要家の私生活や事業活動を反映するエネルギー需要実態を記録されることへの抵抗感と計測データの漏洩に対する懸念とから、研究機関・企業等の計測実施主体と家庭・事業者等の需要家との間では計測データは非公開とする契約が結ばれることが一般的である。この結果、需要実態データに基づく種々の分析や評価などは独自に計測した限られた数の非公開データに基づくものとならざるを得ない。このため、非公開データを用いて設備・機器の性能評価結果が良かったと主張しても、対象需要家(即ちデータ提供需要家)の特異性に起因する可能性もあり、十分な客観性を持ちづらい。
【0004】
そこで、世帯構成や居住地などの多様な需要実態に即したエネルギー機器やエネルギー管理システムのより一層的確な評価を行うためには、多様・多数の需要家で計測されたエネルギー需要実態データを集積したデータベース(以下、エネルギー需要データベースという)が必要になる。さらに、評価結果の客観性や相互検証可能性を高める上では、当該データベースは公開可能であるか、或いは、少なくとも当該データベースの構築に協力する計測実施主体間では共用可能なものである必要がある。
【0005】
そして、エネルギー需要データベースの構築には、少なくとも、データ提供需要家の私生活や事業活動が需要データからは読み取れないようになっていて需要家が安心して計測に協力できること、及び、共用されるデータはエネルギー機器やエネルギー管理システムの様々な評価において有用であることが要求される。
【0006】
需要家のプライバシーに配慮して原需要データを共用可能な仮想的需要データに変換する従来の共用データ生成方法としては、需要データの対象設備・機器としてヒートポンプ式給湯機を取り上げ、当該給湯機の性能評価で重要となる需要データの代表的計測時刻における需要値,微分値,積算値などの特徴量に着目して仮想的需要データを生成するようにし、原需要データとほぼ同じ特徴量を有し結果的に原需要データ計測日の実際の需要曲線と似た形状の需要曲線を区分多項式関数近似によって原需要データから新たに生成するものがある(非特許文献1)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】佐野・篠原,「プライバシーを保護した需要データ収集・共用方式の開発(その2)- 共用可能な需要データ生成方式 -」,電中研研究報告R08006,電力中央研究所,2009年
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、非特許文献1の共用データ生成方法では、計測間隔が1分から10分程度の短時間間隔の計測データに適用した場合には得られた仮想的需要データの需要曲線が原需要データの需要曲線と変わらないものが生成されるため、また、短時間間隔の仮想的需要データを30分毎に30分間合計の需要データに変換したものでは同時間間隔に変換した原需要データとの差が殆どなくなるため、データ提供需要家のプライバシーの秘匿が十分であるとは言えない。このため、共用が困難であると共に、需要家が計測に協力しなくなる事態も懸念されるという問題がある。
【0009】
そこで、本発明は、計測間隔が短い需要データであっても、生活状況等のプライバシーの秘匿性が高く、且つ、需要データの対象設備・機器の性能評価の結果が原需要データを用いた場合の結果と差が小さい仮想的需要データを生成することができる共用データ生成方法、生成装置及び生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
かかる目的を達成するため、請求項1記載の共用データ生成方法は、設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する処理と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する処理と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する処理とを有するにしている。
【0011】
また、請求項2記載の共用データ生成装置は、設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置と接続された装置であって、記憶装置から原需要データを読み込む手段と、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段とを有するようにしている。
【0012】
また、請求項3記載の共用データ生成プログラムは、設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置にアクセス可能なコンピュータを、記憶装置から原需要データを読み込む手段、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段として機能させるようにしている。
【0013】
したがって、これらの共用データ生成方法、生成装置及び生成プログラムによると、一定期間毎に原需要データを用途別に分解すると共に条件を満たす複数の用途を用途グループとしてまとめて用途グループ需要値を算出し、その上で一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成するようにしているので、原需要データの分解と部分的な統合と異なる期間の合成とが原則として行われる(図13参照)。
【0014】
なお、本発明における設備・機器とは、具体的には例えば一般世帯の給湯機やコンロなどが該当する。また、エネルギーとは、具体的には例えば電気や水やガスなどが該当する。そして、用途としては、具体的には例えば、給湯機の場合には洗顔やシャワーや湯張りなどが想定され、コンロの場合には湯沸かしや炒めや煮込みなどが想定される。また、エネルギーについての用途としては、具体的には例えば、電気については各種の室内外照明使用や種々の冷暖房機使用や種々のOA機器利用などが想定され、水については洗顔や食器洗いや湯張りなどが想定され、ガスについては湯沸かし器の種々の利用やコンロの種々の利用などが想定される。しかしながら、設備・機器やエネルギーの具体例或いは用途の具体例は上述のものに限られるわけではない。なお、以下においては、本発明による仮想的需要データの生成の対象となる設備・機器若しくはエネルギーのことを対象設備という。
【0015】
また、本発明における単位計測時間とは、複数の用途の需要が重複して発生しない(言い換えると、複数の用途の需要が混在しない)程度の時間間隔であり、対象設備によって異なり、一例として挙げれば1分から数分程度の間隔が想定される。また、本発明における一定期間とは、本発明によって生成する仮想的需要データの区切りのことであり、例えば1日や1週間や1月程度の期間が想定される。
【発明の効果】
【0016】
本発明の共用データ生成方法、生成装置及び生成プログラムによれば、原需要データの分解と部分的な統合と異なる期間の合成とが原則として行われるので、データ提供需要家の私生活や事業活動が需要データからは読み取れないようにすることができ、生活状況等のプライバシーの秘匿性の向上を図ることが可能になる。そして、需要データに纏わるプライバシー上の問題を回避して共用がし易くなると共に、需要家が計測に協力し易くなることが期待される。
【図面の簡単な説明】
【0017】
【図1】本発明の共用データ生成方法及び共用データ生成プログラムの実施形態の一例を説明するフローチャートである。
【図2】実施形態の共用データ生成方法をプログラムを用いて実施する場合の共用データ生成装置の機能ブロック図である。
【図3】実施例の原需要データとしての給湯需要量(給湯流量)を表す図であり、5日分を同時表示したものである。
【図4】実施例における各用途の1時間当たりの給湯機利用頻度を表す図である。
【図5】実施例における用途のグループ化を行わない場合の、原需要データと仮想的需要データとの1日の総需要量の分布を示す図である。
【図6】実施例における用途のグループ化を行った場合の、原需要データと仮想的需要データとの1日の総需要量の分布を示す図である。
【図7】実施例の各需要データの需要曲線を示す図である。(A)は原需要データの需要曲線を示す図である。(B)は従来の共用データ生成方法によって生成した仮想的需要データの需要曲線を示す図である。(C)は本発明の共用データ生成方法によって生成した仮想的需要データの需要曲線を示す図である。
【図8】原需要データと仮想的需要データとの各時刻におけるデータ特性を説明する図である。(A)は原需要データの各時刻における給湯需要量の平均を示す図である。(B)は仮想的需要データの各時刻における給湯需要量の平均を示す図である。(C)は両データの各時刻における給湯需要量の平均の差を示す図である。
【図9】原需要データと仮想的需要データとの各時刻におけるデータ特性を説明する図である。(A)は原需要データの各時刻における給湯需要量の分散を示す図である。(B)は仮想的需要データの各時刻における給湯需要量の分散を示す図である。(C)は両データの各時刻における給湯需要量の分散の差を示す図である。
【図10】(A)は原需要データの各時刻における給湯需要量の平均を示す図である。(B)は原需要データと仮想的需要データとの各時刻における給湯需要量の標準偏差を示す図である。
【図11】同じ日における原需要データと仮想的需要データとの1日の総需要量の比較散布を示す図である。
【図12】原需要データを用いた場合と仮想的需要データ(10セット)を用いた場合との年間給湯運転コストの差を示す図である。
【図13】本発明の共用データ生成方法における仮想的需要データの生成の流れを説明する図である。
【発明を実施するための形態】
【0018】
以下、本発明の構成を図面に示す実施の形態の一例に基づいて詳細に説明する。
【0019】
図1及び図2に、本発明の共用データ生成方法、生成装置及び生成プログラムの実施形態の一例を示す。
【0020】
本発明では、仮想的需要データを生成するための原需要データとして、任意の設備・機器の利用の程度やエネルギーの利用・消費の程度を需要量と捉えた、例えば1分から数分程度の所定の間隔を単位計測時間として計測された前記所定間隔中合計(言い換えると、単位計測時間当たり)の需要量である需要実態データを用いる。
【0021】
はじめに、本発明の説明で用いる用語及び記号を以下に整理する。なお、本実施形態では、生成する仮想的需要データの時間的な区切りであって経時的・連続的に行われる計測の区切りである一定期間を1日(0時〜24時)とし、需要実態データの計測日数(欠測日を除く)をN日、1日あたりの計測回数をT回とする。なお、前述のことは言い換えると、単位計測時間当たりで計測されたT個のデータからなる一定期間(1日)毎の需要実態データがN組ある、ということになる。
【0022】
1)需要値yd,t
日付dの0時からt番目(ただし、t=1,2,…,T)に計測された需要量の値を表す。
【0023】
2)用途需要値yud,t
計測対象の需要家における需要データの対象設備の利用用途の総数をUとして、日付dの0時からt番目に計測された用途u(ただし、u=1,2,…,U)の需要量の値を表す。
【0024】
そして、需要値yd,tは、日付d及び計測順番tにおける全ての用途需要値yud,tの総和であり、数式1が成り立つ。
【数1】
【0025】
3)用途グループg
需要曲線の需要値が互いに関連して変動する複数の用途uを一つのグループにまとめたものである。用途グループgに属する用途uの集合を数式2の通りに表記する(文章中では、数式2を{ug1,…,uggn}と表記する;添字gnは用途グループgに属する用途の数を表す)。全ての用途uはいずれかの用途グループgに属する。つまり、用途グループgの総数をG(≦U)として、G個の用途グループは、U個の用途をG個にまとめたものとして形成されるものである。
【数2】
【0026】
4)用途グループ需要値ygd,t
日付dのt番目に計測された用途グループgの需要量の値を表す。用途グループg={ug1,…,uggn}の日付d及び計測順番tにおける需要値ygd,tは、当該用途グループgに属する用途uの用途需要値yud,tの総和であり、数式3が成り立つ。
【数3】
【0027】
また、日付d及び計測順番tにおける需要値yd,tと用途グループ需要値ygd,tとの間には数式4の関係が成り立つ。
【数4】
【0028】
5)1日の、総需要量ytotal,d,用途の総需要量yutotal,d,用途グループの総需要量ygtotal,d
1日の総需要量ytotal,dは日付dに計測された総需要量を表し、数式5が成り立つ。また、日付dに計測された用途uの総需要量yutotal,d及び用途グループgの総需要量ygtotal,dについても数式5と同様の式が成り立つ。
【数5】
【0029】
6)需要曲線vecyd
日付dの0時〜24時の需要値の経時変化をまとめてベクトル表記したものであり(文章中では、ベクトルyをvecyと表記する)、vecyd=(yd,1,…,yd,T)である。また、日付dの0時〜24時の、用途uの需要値の経時変化である用途需要曲線vecyud=(yud,1,…,yud,T)、用途グループgの需要値の経時変化である用途グループ需要曲線vecygd=(ygd,1,…,ygd,T)も同様に表記する。
【0030】
7)需要曲線vecyの多次元分布F^(vecy)
多次元分布F^(vecy)(本来の表記は数式6−1)は、N日分の需要曲線vecyから構成されるT次元分布である。また、N日分の、用途uの用途需要曲線vecyuのT次元分布をF^u(vecyu)(本来の表記は数式6−2)と表記し、用途グループgの用途グループ需要曲線vecygのT次元分布をF^g(vecyg)(本来の表記は数式6−3)と表記する。
【数6】
【0031】
なお、特定の日付dであることを問題としない場合には、上記の各記号において添字dを省略して表記する場合がある。また、原需要データと仮想的需要データとを区別するため、仮想的需要データの値の右肩に“*”を付ける。
【0032】
続いて、本発明の共用データ生成方法における仮想的需要データの生成原理を説明する。
【0033】
本発明において対象とする需要データは、N日分の、例えば1分から数分程度の所定の間隔で計測された計測間隔中合計の対象設備の需要量を表すデータである。そして、収集された需要曲線vecyの分布であるF^(vecy)はN日分のデータから構成されたものであり、計測対象の需要家で計測される需要曲線の真の多次元分布F(vecy)とは異なる。しかし、F(vecy)は未知であり、原需要データの代替となる共用可能な仮想的需要データを生成することを目的とするため、生成された日付dの仮想的需要データの需要曲線vecy*dがF^(vecy)からの標本であることを示すことによって、vecy*dが対象需要家の需要データであるとする。
【0034】
例えば数十分間隔(当該間隔中合計)で計測された対象設備の需要データの需要量は、複数の用途による対象設備の需要量の総量となっている場合が多く、用途との関係が反映されにくい。しかし、1分から数分程度の短い間隔(当該間隔中合計)で計測された対象設備の需要データは、用途と需要値との関係が明瞭に見られる場合が殆どである。そして、当該関係が明瞭であることが設備・機器性能評価や分析における対象設備需要データの有用性に貢献すると考えられる。このため、生成される仮想的需要データにおいて、当該仮想的需要データを設備・機器性能評価や分析に用いることを想定し、用途と需要値との関係が保存されるようにする。
【0035】
そこで、本発明では、「1回の設備利用」を需要値がゼロから正の値になった計測時刻から再びゼロになる一つ前の計測時刻までの設備利用とすると共に、「1回の設備利用」内の各時刻における需要値は或る単一の用途の利用によるものであるとする。そして、「1回の設備利用」を単位として仮想的需要データを生成する。
【0036】
具体的には、まず、収集されたN日分の原需要データを「1回の設備利用」単位で用途別に分解し、N日分の用途uの需要曲線vecyuから得られる用途uの多次元分布をF^u(vecyu)(ただし、u=1,2,…,U)とする。
【0037】
用途uの多次元分布F^u(vecyu)から無作為に抽出した或る1日の用途需要曲線をvecyu*として、全ての用途について需要曲線(vecy1*,…,vecyU*)を抽出し、仮想化した需要曲線vecy*を前記数式1を用いて生成する。
【0038】
同様にしてN日分の仮想化した需要曲線を生成すると、vecyu*がF^u(vecyu)からの無作為抽出であるため、N日分のvecyu*の多次元分布はF^u(vecyu)に一致する。ここで、日付dの需要曲線vecydは、各用途の用途需要曲線vecyud(ただし、u=1,2,…,U)を全ての用途について足し合わせた総需要量として表される。
【0039】
通常は、原需要データの需要曲線vecyから得られる多次元分布F^(vecy)は、単純に用途需要曲線vecyuの多次元分布F^u(vecyu)の和で表すことはできない(すなわち、F^(vecy)≠F^1(vecy1)+F^2(vecy2)+…+F^U(vecyU)である)。このため、F^u(vecyu)とF^u*(vecyu*)とは一致するが、F^(vecy)とF^(vecy*)とは一致しない。したがって、この過程で生成された仮想的需要データは、原需要データの需要曲線から得られる多次元分布と異なるため、原需要データの代替にはなり得ない。
【0040】
F^(vecy)とF^(vecy*)とを一致させるためには、用途u=1,2,…,Uにおいて用途需要曲線vecyuの需要値が互いに関連して変動する用途間の関係が仮想的需要データにおいても同じになっている必要がある。ここで、時間的に連続して使用される用途間では1日の需要値の変動に互いに関連がある。本発明では、原需要データが有する用途間の関連関係を仮想的需要データにおいても保存するようにする。
【0041】
用途間の関連関係が保存されるためには、具体的には、1日の総需要量の分布が原需要データと仮想的需要データとで同じになる必要がある。そこで、1日の総需要量の分布が原需要データと仮想的需要データとで等しくなるように、需要値が互いに関連して変動する用途を一つのグループ(即ち、用途グループ)にまとめる。
【0042】
本発明では、異なる計測日の用途グループ需要曲線をどの計測日のものに変えても1日の総需要量の分布が原需要データと仮想的需要データとで同じになるようにするため、用途グループ間では用途グループ需要曲線の需要値が互いに関連して変動しないように用途グループを構成する。
【0043】
なお、用途グループを構成した後、用途グループ相互間の独立性の検定を行い、用途グループ間で関連性がないことを確認することが好ましい(言い換えると、独立性の検定を行うことは本発明の必須要件ではない)。独立性の検定の方法は特定の方法に限られるものではなく、例えばピアソンによる独立性の検定(例えば、岡本・鈴木・杉山,「基本統計学」,実教出版株式会社,1977年)を用いることが考えられる。
【0044】
そして、原需要データvecyの需要曲線の需要値が用途グループ間で互いに無関係に変動するようにすることにより、言い換えると、そのように用途グループを構成することにより、原需要データの需要曲線から得られる多次元分布F^(vecy)は各用途グループ需要曲線から得られる多次元分布の和で表すことができる(すなわち、F^(vecy)=F^1(vecy1)+F^2(vecy2)+…+F^G(vecyG)である)。
【0045】
F^g(vecyg)とF^g*(vecyg*)とは一致し、仮想的需要データの需要曲線vecy*から得られる多次元分布F^*(vecy*)はF^(vecy)と一致する。このことにより、生成された仮想的需要データの需要曲線vecy*は、原需要データから得られる需要曲線の分布と同じ分布からの抽出であるとみなせる。このため、vecy*は原需要データからの標本であるとし、仮想的需要データは原需要データの代替として用いることができる。
【0046】
この操作では、仮想化した需要曲線を生成する対象日における用途グループ需要曲線を異なる計測日の用途グループ需要曲線vecyg*と入れ替えることによって、vecygの需要値をvecygの多次元分布F^g(vecyg)に従ってvecyg*の需要値へ時刻方向にずらしたものとみなせる。また、vecyg*に入れ替えることによってvecygにはない需要が新たに発生した場合や、或いは、vecygにあった需要がvecyg*では消失している場合には、F^g(vecyg)に従って需要が発生或いは消失したものとみなせる。
【0047】
異なる日の各用途グループ需要曲線を組み合わせて生成される仮想的需要データについて、需要データの対象設備によっては、例えば季節がまったく異なるなどのように対象設備の需要に変化を与える外的要因が異なる用途グループ需要曲線が組み合わされた場合には対象需要家において実際に計測されるとは考えにくい。そこで、原需要データの特性を調べ、対象設備の需要に変化を与える外的要因の変化(気候や生活パターンの変化など)が小さい期間において同じ用途グループの異なる日に計測された需要曲線と組み合わせる。なお、平日は不在であり、在宅は土日のみであるなど、曜日によって1日の需要が異なる需要家に対しては、平日同士または土日同士での用途グループ需要曲線の組み合わせに限定することも有効である。
【0048】
そして、上述の原理に基づいて仮想的需要データを生成するため、本発明の共用データ生成方法は、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する処理(S2)と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する処理(S3,S4)と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する処理(S5)とを有するようにしている。なお、本実施形態では、上記一定期間を1日としている。
【0049】
また、上記共用データ生成方法は、本発明の共用データ生成装置として実現され得る。この共用データ生成装置は、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置と接続された装置であって、記憶装置から原需要データを読み込む手段と、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段と、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段と、用途グループ毎に一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段とを備えている。なお、本実施形態では、上記一定期間を1日としている。
【0050】
上述の共用データ生成方法及び共用データ生成装置は、本発明の共用データ生成プログラムをコンピュータ上で実行することによっても実現される。本実施形態では、共用データ生成プログラムをコンピュータ上で実行する場合を例に挙げて説明する。
【0051】
共用データ生成プログラム17を実行するためのコンピュータ10(即ち共用データ生成装置10)の全体構成を図2に示す。この共用データ生成装置10は、制御部11、記憶部12、入力部13、表示部14及びメモリ15を備え相互にバス等の信号回線により接続されている。また、共用データ生成装置10にはデータサーバ16がバス等の信号回線により接続されており、その信号回線を介して相互にデータや制御指令等の信号の送受信(即ち入出力)が行われる。
【0052】
本実施形態では、例えば一年から数年程度の期間に亘って計測対象の需要家において日付dの0時からt番目に計測された需要値yd,t(即ち、原需要データ)が、原需要データベース18としてデータサーバ16に蓄積される。
【0053】
制御部11は記憶部12に記憶されている共用データ生成プログラム17によって共用データ生成装置10全体の制御並びに共用データとしての仮想的需要データの生成等に係る演算を行うものであり、例えばCPU(中央演算処理装置)である。
【0054】
記憶部12は少なくともデータやプログラムを記憶可能な装置であり、例えばハードディスクである。
【0055】
メモリ15は制御部11が種々の制御や演算を実行する際の作業領域であるメモリ空間となるものであり、例えばRAM(Random Access Memory の略)である。
【0056】
入力部13は少なくとも作業者の命令を制御部11に与えるためのインターフェイスであり、例えばキーボードである。
【0057】
表示部14は制御部11の制御により文字や図形等の描画・表示を行うものであり、例えばディスプレイである。
【0058】
そして、共用データ生成プログラム17を実行することにより、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置としてのデータサーバ16にアクセス可能なコンピュータである共用データ生成装置10の制御部11には、データサーバ16から原需要データを読み込む手段としての原需要データ読込部11a、原需要データを一定期間毎に単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段としての用途分解部11b、一定期間毎の複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる複数の用途別の需要データを単位計測時間毎に足し合わせて一定期間毎の用途グループ需要値を算出する手段(仮想化需要曲線生成部11c,分布比較部11d,用途グループ構成部11e)、用途グループ毎に一定期間の用途グループ需要値の中から無作為に抽出したものを足し合わせて一定期間の仮想的需要データを生成する手段としての仮想的需要データ生成部11fが構成される。なお、本実施形態では、上記一定期間を1日としている。
【0059】
本実施形態の共用データ生成方法の実行にあたっては、まず、制御部11の原需要データ読込部11aが、計測対象の需要家において計測され収集されたN日分の原需要データをデータサーバ16から読み込む(S1)。
【0060】
具体的には、本実施形態では、原需要データ読込部11aが、原需要データベース18として蓄積されている需要値yd,tをデータサーバ16から読み込む。そして、原需要データ読込部11aは、読み込んだ需要値yd,tをメモリ15に記憶させる。
【0061】
次に、制御部11の用途分解部11bが、原需要データを用途別に分解する(S2)。なお、仮想的需要データ生成の対象需要家が複数あり、S1の処理において複数の需要家の原需要データ(需要値yd,t)をまとめて読み込んだ場合には、S2以降の処理は需要家毎に行う。
【0062】
用途分解部11bは、本実施形態では、原需要データの収集対象設備であって仮想的需要データの生成対象設備について想定される用途別に、クラスタリングを行うことによって原需要データを分解する。
【0063】
原需要データを用途別に分解するために行うクラスタリングは、データをクラスに分類することができる方法であればどのような方法を用いても良い。具体的には例えば、データからクラス数及び各クラスに属するデータの平均値を自動的に決定する方法の一つであるX-means法を用いることが考えられる。
【0064】
X-means法は、K-means法によってデータをクラスに分類して各クラスに属するデータの平均値を求め、更に、クラス数をベイズ型情報量基準(BICとも呼ばれる)に基づいて自動的に決定するものである。なお、X-means法やK-means法やベイズ型情報量基準自体は周知の技術であるのでここでは詳細については省略する(例えば、Dan Pelleg and Andrew Moore,“Accelerating exact k-means algorithms with geometric reasoning”,International Conference on Knowledge Discovery and Data Mining,pp.277-281,1999年;C. M. Bishop著,元田・栗田・樋口・松本・村田監訳,「パターン認識と機会学習 下」,シュプリンガー・ジャパン,2008年;小西・北川,「予測と発見の科学 情報量基準」,朝倉書店,2004年 を参照)。
【0065】
X-means法を原需要データに適用することにより、計測対象の需要家で計測された原需要データの総用途数Uが決定され、「1回の設備利用」の用途分解が行われる。
【0066】
具体的には、ほぼ同一の需要量を有する設備利用は同一の用途の設備利用であると推定する。ただし、対象設備の種類によっては継続時間の長い利用での需要量の方が安定する場合もあり、用途別の需要量の代表値(即ち平均値)としてより一層適切な場合がある。このため、継続時間を考慮しながら、適切な総用途数U及び各用途の代表的需要量μkをK-means法とベイズ情報量基準とを用いて推定する。
【0067】
本発明では、原需要データで需要量がゼロでなくなり(即ち、需要が発生し)再びゼロになる(即ち、需要が終了する)直前までを「設備利用」の単位とし、これら「設備利用」を分析することによって総用途数Uと各用途uの平均需要量μuとを推定する。ここで、「設備利用」の分析では、計測期間中の継続時間s以上の設備利用を対象とする。このような設備利用の発生回数をNs回と表記する。
【0068】
K-means法では、用途uの需要量は平均μu,分散σ2(用途によらず同一)の正規分布に従うと仮定する。このとき、各設備利用iが属する用途をu(i)とすると共に各設備利用の需要量をyiとすると、用途uの平均需要量の最尤推定値μ^u(本来の表記は数式7−1)は用途uに属するnu個の設備利用の需要量の平均となり、分散の最尤推定値σ^2(本来の表記は数式7−2)は設備利用iの需要量yiと属する用途u(i)の平均需要量μ^uとの差の2乗平均となる(数式8)。
【数7】
【数8】
【0069】
そして、K-means法では、分散の最尤推定値σ^2が最小となるように各設備利用が属する用途を決定する。
【0070】
なお、用途分類を行う上での最適な総用途数Uは、数式9に示すベイズ情報量基準(BIC)が最小になるように決定する。
【数9】
【0071】
ただし、継続時間sを変更するとベイズ情報量基準による最適な用途数Uは変化する。継続時間sが大きいほど対象となる設備利用数Nsは少なく、また、用途の単位計測時間当たりの需要量の代表性が高くなる。そこで、大きな継続時間sで得られた用途を大きくは変えないようにしながら継続時間sを順次小さくしていき、最適な用途数U及びその期待値μ^uを決定する。具体的には以下の手順で行う。
【0072】
〈ステップ1〉
継続時間sをsstartからΔsずつ増やしていき、最適とみなされる用途数が1又は継続時間s=sendとなった時点を開始継続時間s=smaxとする。この時得られた最適な用途数をUsmax,各用途の平均需要量の最尤推定値をμ^uとする。なお、sstart,Δs,sendはいずれも、特定の値に限られるものではなく、対象設備の種類・特性や原需要データにおける利用実態などを考慮して適切な値に設定される。具体的には例えば、sstartは5分程度,Δsは1分程度,sendは10分程度とすることが考えられる。
【0073】
〈ステップ2〉
継続時間s=s−Δsとする。この時、既に得られているUs+1個の用途の最尤推定値μ^uは固定し、未知の平均μを持つ新たな用途(Us+1+1)を追加した時にBICが改善するか否かを調べる。改善する場合は、新たな用途を更に追加して継続時間sでの最適な用途数Usを求める。
【0074】
〈ステップ3〉
最適な用途数が増加しない(即ち、Us=Us+1)場合は終了する。
【0075】
〈ステップ4〉
最適な用途数Usが増加した場合は、K-means法によってUs個の全用途の最適なμ^uを推定し直し、ステップ2に戻る。
【0076】
本実施形態では、用途分解部11bが、S1の処理においてメモリ15に記憶された(或る需要家の)原需要データの需要値yd,tをメモリ15から読み込み、「1回の設備利用」を抽出する。具体的には、日付d,計測順番t(これは単位計測時間,計測時刻としての情報も有する),「1回の設備利用」毎の識別子(例えば1からの連番),需要値がゼロから正の値になりその後にゼロになるまでの需要値yd,tの組み合わせデータの集合を「1回の設備利用」データとしてメモリ15に記憶させる。なお、需要値がゼロから正の値になりその後にゼロになるまでが「1回の設備利用」であり、同じ識別子が付与される。
【0077】
用途分解部11bは、さらに、上述のように、「1回の設備利用」各々について需要値が同じであれば用途が同じであると判断することにより、需要値yd,tを用いてクラスタリングを行って原需要データを用途別に分解する。
【0078】
そして、用途分解部11bは、原需要データの需要値yd,tの各々に用途uを追加してメモリ15に記憶させる。
【0079】
次に、用途グループの検討(S3)として、制御部11の仮想化需要曲線生成部11cが、仮想化した需要曲線を生成する(S3−1)。
【0080】
N日分の原需要データと仮想化した需要データとのそれぞれから得られる1日の総需要量(即ち、ytotalとy*total)の分布の差が小さくなることを条件として、需要曲線の需要値が互いに関連して変動する用途を一つのグループにまとめる。
【0081】
具体的には、考えられる全ての用途の組み合わせで用途をグループにまとめて仮の用途グループの組み合わせを構成する。そして、当該仮の用途グループの組み合わせ毎に数式3を用いて用途グループ需要値ygd,tを算出してN日分の用途グループ需要曲線vecygdを生成する。
【0082】
そして、仮の用途グループ毎のN日分の用途グループ需要曲線vecygd=(ygd,1,…,ygd,T)から無作為に1日分の用途グループ需要曲線vecyg*を抽出し、数式4を用いて1日分の仮想化した需要曲線vecy*を生成する。同様に、1日分の用途グループ需要曲線vecyg*を抽出する際の乱数を様々に変えて仮の用途グループの組み合わせ毎にN日分の仮想化した需要曲線vecy*をXセットずつ生成する。なお、本処理における用途グループ需要曲線の抽出では、特定の用途グループ需要曲線が複数回抽出されることがあり得る一方で、全く抽出されない用途グループ需要曲線もあり得る。
【0083】
上述の手順により、考えられる全ての用途の組み合わせとして構成された仮の用途グループの組み合わせの全てについてN日分の仮想化した需要曲線をXセットずつ生成する。なお、需要曲線のセット数Xの値は、特定の値に限られるものではなく、続くS3−2の処理及びS4の処理も踏まえて適切な値に設定される。具体的には例えば数十から数百程度の範囲に設定することが考えられる。また、需要曲線のセット数Xの値は共用データ生成プログラム17に予め規定されるようにしても良いし、当該S3−1の処理の段階で入力部13を介して指定・変更されるようにしても良い。
【0084】
本実施形態では、仮想化需要曲線生成部11cが、S2の処理において用途uが追加されてメモリ15に記憶された原需要データの需要値yud,tをメモリ15から読み込み、上述の手順によって仮の用途グループの組み合わせ毎にN日分の用途グループ需要曲線vecygdを生成すると共に仮想化した需要曲線vecy*をXセットずつ生成する。
【0085】
そして、仮想化需要曲線生成部11cは、仮の用途グループの組み合わせ毎に、N日分の用途グループ需要曲線vecygd(即ち、用途グループ需要値ygd,t)、並びに、XセットのN日分の仮想化した需要曲線vecy*の需要値y*d,tをメモリ15に記憶させる。
【0086】
次に、制御部11の分布比較部11dが、原需要データと仮想化した需要データとの総需要量の分布を比較する(S3−2)。
【0087】
このS3−2の処理における総需要量は、経時的・連続的に行われる計測の単位(言い換えると、区切り)である一定期間毎の総需要量のことである。本実施形態では、一定期間を1日(0時〜24時)としているので、1日の総需要量の分布を比較する。
【0088】
原需要データに基づく1日の総需要量ytotal,dは、原需要データの需要値yd,tと数式5とを用いて算出される。また、仮想化した需要データに基づく1日の総需要量y*total,dは、S3−1の処理において生成された仮想化した需要曲線vecy*の需要値y*d,tと数式5とを用いて算出される。なお、S3−1の処理を受け、仮想化した需要データに基づく1日の総需要量は、仮の用途グループの組み合わせそれぞれについてN日分の1日総需要量がXセット算出される。
【0089】
そして、原需要データに基づく1日の総需要量のN日分の分布と仮想化した需要データに基づく1日の総需要量のN日分の分布とが等しいか否かを検定する。二つの分布が等しいか否かの検定は、二つのデータセットの分布が等しいか否かを検定することができる方法であればどのような方法を用いても良い。具体的には例えばコルモゴルフ・スミルノフ検定(KS検定とも呼ばれる;例えば、岡本・鈴木・杉山,「基本統計学」,実教出版株式会社,1977年)を用いることが考えられる。なお、本実施形態では、二つのデータセットの分布が等しいか否かの検定に纏わる処理が共用データ生成プログラム17に組み込まれる。
【0090】
本実施形態では、分布比較部11dが、S1の処理においてメモリ15に記憶された原需要データの需要値yd,tをメモリ15から読み込んで1日の総需要量ytotal,d(N日分)を算出すると共に、S3−1の処理においてメモリ15に記憶された仮想化した需要曲線の需要値y*d,tをメモリ15から読み込んで1日の総需要量y*total,d(仮の用途グループの組み合わせそれぞれについてN日分をXセット)を算出する。
【0091】
さらに、分布比較部11dは、例えばKS検定を用いて原需要データの1日の総需要量ytotal,dのN日分の分布と仮想化した需要曲線の1日の総需要量y*total,dのN日分の分布とが等しいか否かを、仮の用途グループの組み合わせそれぞれについてのXセット毎に検定する。なお、分布の検定は、一つの原需要データの分布と、仮の用途グループの組み合わせ毎のXセットの仮想化した需要データの分布のそれぞれとについて行われる。
【0092】
そして、分布比較部11dは、仮の用途グループの組み合わせ毎に、Xセットの仮想化した需要データの分布のそれぞれについて、原需要データの分布と等しいか否かをメモリ15に記憶させる。
【0093】
次に、制御部11の用途グループ構成部11eが、仮想化した需要データを生成する用途グループを構成する(S4)。
【0094】
S3−2の処理によって原需要データから得られる1日の総需要量のN日分の分布と有意な差がないとみなされた仮想化した需要データがXtセット(以下、判定セット数Xt)以上になっている仮の用途グループの組み合わせのうち、秘匿性を担保するため、用途グループ数が最も多くなっている用途の組み合わせを、仮想化した需要データを生成する用途グループとして特定する。なお、用途グループ数が多いほど、より多くの異なる一定期間毎の需要データを使用して仮想需要データが生成されるので、生成された仮想需要データは原需要データとは異なるものが生成されて原需要データそのものの復元が困難になる。また、判定セット数Xtは特定の値に限られるものではなく、需要曲線のセット数Xや元のデータ(ここでは原需要データ)から無作為に抽出して作成されたデータの分布が元のデータの分布と概ね等しくなると期待される水準を考慮して適当に設定される。具体的には例えば、判定セット数Xtは需要曲線のセット数Xの9割程度とすることが考えられる。また、判定セット数Xtの値は共用データ生成プログラム17に予め規定されるようにしても良いし、当該S4の処理の段階で入力部13を介して指定・変更されるようにしても良い。
【0095】
なお、上述の手順によって用途グループ数が同じであるために仮の用途グループの組み合わせが複数特定された場合には、それらのうちで原需要データの分布と有為な差がないと判断された仮想化した需要データのセット数が最も多い仮の用途グループの組み合わせを、仮想化した需要データを生成する用途グループとする。また、一つの用途のみによって一つの用途グループが構成されることもあり得る。
【0096】
本実施形態では、用途グループ構成部11eが、S3−2の処理においてメモリ15に記憶された1日総需要量の分布の等否の検定結果を読み込み、仮の用途グループの組み合わせ毎に、Xセットの仮想化した需要データのうち原需要データの分布と等しいと判断されたセット数をカウントする。
【0097】
さらに、用途グループ構成部11eは、上述でカウントされたセット数が判定セット数Xt以上になっている仮の用途グループの組み合わせを選択すると共に、選択された仮の用途グループの組み合わせのうちで用途グループ数が最も多いものを特定する。複数の仮の用途グループの組み合わせが選択された場合には、それらのうちで原需要データの分布と有為な差がないと判断された仮想化した需要データのセット数が最も多い仮の用途グループの組み合わせを特定する。
【0098】
そして、用途グループ構成部11eは特定された仮の用途グループの組み合わせを仮想化した需要データを生成する用途グループgの組み合わせとして、各用途uと当該用途uの用途グループgとの対応をメモリ15に記憶させる。
【0099】
次に、制御部11の仮想的需要データ生成部11fが、仮想的需要データを生成する(S5)。
【0100】
具体的には、S4の処理において特定された用途グループの組み合わせにおける各用途グループgについての日付dの用途グループ需要曲線vecyg*dを、当該日付dの前後M日の期間内の用途グループ需要曲線の中から無作為に抽出し、数式4を用いて1日分の仮想的需要データy*(即ち、需要値y*d,t)を生成する。無作為に抽出する際の乱数を様々に変えて、N日分の、1日分の仮想的需要データy*を生成する。なお、無作為抽出の期間Mは特定の日数に限られるものではなく、需要に変化を与える外的要因の変化が小さいと考えられる期間を考慮して適切な日数に設定される。また、この期間Mは、対象設備に関しては需要に変化を与える気候や生活パターン等の外的要因がない(言い換えると、例えば季節などによって需要特性に変化がない)などの場合には、設定しなくても良い。
【0101】
本実施形態では、仮想的需要データ生成部11fが、S3−1の処理においてメモリ15に記憶された仮の用途グループの組み合わせ毎のN日分の用途グループ需要曲線vecygd(即ち、用途グループ需要値ygd,t)のうちS4の処理において特定された用途グループの組み合わせについてのN日分の用途グループ需要曲線vecygd(用途グループ需要値ygd,t)をメモリ15から読み込み、これら用途グループ需要曲線vecygd(用途グループ需要値ygd,t)を用いて1日分の仮想的需要データy*(即ち、需要値y*d,t)を生成する。
【0102】
そして、仮想的需要データ生成部11fは、1日分の仮想的需要データy*(需要値y*d,t)を例えばデータサーバ16内に格納される仮想的需要データベース19に蓄積する。
【0103】
そして、制御部11は仮想的需要データの生成処理を終了する(END)。
【0104】
以上のように構成された本発明の共用データ生成方法、生成装置及び生成プログラムによれば、原需要データの分解と部分的な統合と異なる期間の合成とが原則として行われるので、データ提供需要家の私生活や事業活動が需要データからは読み取れないようにすることができ、生活状況等のプライバシーの秘匿性の向上を図ることが可能になる。
【0105】
なお、上述の形態は本発明の好適な形態の一例ではあるがこれに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変形実施可能である。例えば、本実施形態では、対象設備の単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置をデータサーバ16としているが、前記記憶装置はこれに限られず、例えば記憶部12を記憶装置として使うようにしても良いし、制御部11との間で入出力をすることができる外付けの種々の記憶媒体・記憶装置でも良い。
【実施例1】
【0106】
需要データの対象設備をヒートポンプ式給湯機とし、本発明の共用データ生成方法、生成装置及び生成プログラムを、ヒートポンプ式給湯機を利用する需要家における実際の給湯需要データを原需要データとした仮想的需要データの生成に適用した実施例を図3から図12を用いて説明する。
【0107】
本実施例では、或る需要家を対象にヒートポンプ式給湯機における1分間隔で計測された一年分(欠測があったため計測日数N=358)の給湯需要データを原需要データとして用いた。本実施例では、一定期間は1日であり、単位計測時間は1分である。
【0108】
ここで、本実施例における需要データの対象設備であるヒートポンプ式給湯機について説明する。貯湯タンクを持つヒートポンプ式給湯機制御は、例えば早朝に1日分の給湯需要量の多くを貯めておき、湯が不足しそうな時には沸き増しを行う。このとき、早朝に貯める湯量の決定には、1日の総需要量などの需要量の積算値が重要な要素となり、一方、沸き増しを行う貯湯量の決定には湯切れが生じそうな時刻における最大需要量が重要な要素となる。そのため、ヒートポンプ式給湯機の機器性能評価においては、需要データの計測時刻における需要値,微分値,積算値が重要な需要特性となる。
【0109】
そして、原需要データを用途別に分解した(S2)。
【0110】
まず、本実施例の原需要データである給湯需要データの特性を概観するため、或る5日間に計測された給湯流量(単位:L(リットル))を、当該5日分を全て重ねることによって図3に示す結果が得られた。
【0111】
図3から、異なる時刻の給湯利用であるにもかかわらず、単位計測時間当たりの給水流量がほぼ同じである複数の代表的な値があることが確認された。各代表値は、湯張り制御や追い炊き制御に基づく給湯量であり、利用者や用途固有の蛇口の開口度合いなどによるものであると考えられた。
【0112】
ベイズ情報量基準を用いて給湯需要データの用途数を決定すると共に、K-means法によって各用途の平均流量を決定し、原需要データとしての給湯需要データの用途分解を行った。
【0113】
ベイズ情報量基準による用途分解の結果、本実施例で対象とした給湯需要データの用途数は6となった。各用途の平均流量を表1に示す。なお、継続時間sは3分になった。
【表1】
【0114】
本実施例では、また、「1回の給湯機利用」の時間が2分以内である需要値を「短時間利用」とすると共に、いずれの用途にも属しなかった需要値を「その他利用」とし、全用途数Uを8とした。
【0115】
本実施例の給湯需要データの特性を概観するため、また、各用途において1日の0時から24時まで1時間毎に1時間内の給湯機利用頻度を、各時間帯において需要値が0を含まない正の値であった回数として数えることによって図4に示す結果が得られた。
【0116】
図4から、夕方のみに利用頻度が高い用途と、朝と夕方との両方に利用頻度が高い用途とがあることが確認された。
【0117】
次に、用途グループの検討(S3)として、仮想化した需要曲線を生成した(S3−1)。
【0118】
すなわち、原需要データと仮想的需要データとの需要曲線の1日総需要量(即ち、ytotalとy*total)の分布を等しくするために、KS検定によってytotalとy*totalとの分布が等しいか否かを検定し、分布が等しいとみなされた用途を組み合わせることによって用途グループを構成した。
【0119】
具体的には、はじめに、用途をグループにまとめずに8つの用途それぞれについてN日分の用途需要曲線vecyu(u=1,2,…,8)から1日分の需要曲線vecyu*を無作為に抽出し、仮想的需要データを数式1を用いて生成した。
【0120】
次に、原需要データと仮想的需要データとの1日の総需要量の分布を比較した(S3−2)。
【0121】
生成された仮想的需要データの1日の総需要量y*totalを数式5を用いて計算し、総需要量y*totalの分布として図5に示す結果が得られた。図5に示す例では、1日の総需要量の分布は原需要データと仮想的需要データとで異なっている。
【0122】
次に、仮想的需要データを生成する用途グループを構成した(S4)。
【0123】
用途をグループにまとめた結果、8つの用途は4つの用途グループA,B,C,Dにまとめられた。各用途グループに属する用途を表2に示す。
【表2】
【0124】
1日の総需要量の分布が原需要データと仮想的需要データとで同じになるように用途をグループにまとめることにより、1日の総需要量の分布として図6に示す結果が得られた。
【0125】
図6に示す結果から、複数の用途をグループにまとめることにより、用途のまま組み合わせて仮想的需要データを生成した場合に比べ、仮想的需要データの1日の総需要量の分布が原需要データの分布に近いものになることが確認された。
【0126】
また、N日分の用途グループ需要曲線から各用途グループの1日の総需要量ygtotalを計算して用途グループ間の相関係数を算出することによって表3に示す結果が得られた。
【表3】
【0127】
表3に示す結果から、用途グループ間では相関係数がほぼゼロになっていることが確認された。
【0128】
さらに、ピアソンの独立性の検定を行うことにより、用途グループ需要曲線は互いに需要値の変動に関連が無いことが確認された。
【0129】
次に、計測日数N(=358)日分の仮想的需要データを生成する(S5)。
【0130】
本実施例では、気候の変動など給湯需要に変化を与える外的要因の変化が、仮想的需要データを生成する対象日の前後2週間以内(即ち、無作為抽出の期間M=14日)であれば小さいと想定した。そして、データ生成対象日の前後2週間以内の原需要データから無作為に抽出した用途グループ需要曲線を用いて仮想的需要データを生成した。
【0131】
本実施例では、同一日の仮想的需要データと原需要データとの需要曲線が大きく異なったものにならないようにするため、1日の総需要量が最も大きい用途グループAの用途グループ需要曲線は原需要データと仮想的需要データとで同一日とものとした。
【0132】
計測日数N(=358)日分の仮想的需要データを作成し、そのうちの一例として或る1日の仮想的需要データの需要曲線として図7(C)に示す結果が得られた。図7には、当該仮想的需要データと同一日の(言い換えると、データ生成対象日として対応する)原需要データの需要曲線(同図(A))、及び、非特許文献1の共用データ生成方法によって生成した仮想的需要データの需要曲線(同図(B))も示す。
【0133】
図7に示す結果から、非特許文献1の共用データ生成方法によって生成した仮想的需要データの需要曲線(同図(B))は、原需要データの需要曲線(同図(A))と酷似しており、仮想的需要データから読み取れるデータ提供需要家の私生活が原需要データから読み取れるものと変わらず、秘匿性が低いものであることが確認された。
【0134】
一方、本発明の共用データ生成方法によって生成した仮想的需要データの需要曲線(図7(C))は、用途グループA,B,C,Dのそれぞれにおいて異なる日の用途グループ需要曲線が組み合わされて生成されていることが確認された。そして、仮想的需要データから読み取れるデータ提供需要家の私生活が原需要データから読み取れるものとは異なっており(例えば、仮想的需要データ(同図(C))では昼間(大凡11時〜14時)に給湯需要が発生しているが、原需要データ(同図(A))では同時間帯に給湯需要は発生していない)、秘匿性が高いデータが生成されていることが確認された。
【0135】
また、計測日数N日分の原需要データと仮想的需要データとの各時刻における平均及び両データの平均の差を算出して図8に示す結果が得られ(同図(A)は原需要データの平均、同図(B)は仮想的需要データの平均、(C)は両データの平均の差)、両データの各時刻における分散及び両データの分散の差を算出して図9に示す結果が得られた(同図(A)は原需要データの分散、同図(B)は仮想的需要データの分散、(C)は両データの分散の差)。図8及び図9から、原需要データと仮想的需要データとの各時刻における平均の差及び分散の差は0の周辺に分布していて小さく、大きな偏りは見られないことが確認された。
【0136】
また、各計測日時における原需要データの需要値(即ち、給湯需要量)と仮想的需要データの需要値(即ち、給湯需要量)との差異を標準偏差で表すことによって図10に示す結果が得られた(同図(B))。図10では原需要データの1日の各時刻における需要値の平均を併せて示した(同図(A))。
【0137】
図10から、各時刻における標準偏差は原需要データの平均値と同じくらいの差が生じていることが確認された。また、原需要データと仮想的需要データとの各時刻における需要値の平均及び分散はほぼ等しい(図8及び図9参照)のに対し、図10に示すように各時刻における原需要データの需要値と仮想的需要データの需要値との間には差異が明瞭に見られることが確認された。このことから、仮想的需要データは原需要データとは異なるが、計測日数N日分の原需要データと仮想的需要データとの各時刻における需要値の平均及び分散はほぼ等しくなっていることが確認された。
【0138】
また、同じ日付の原需要データと仮想的需要データとの1日の総需要量を比較することによって図11に示す散布図が得られた。図11から、1日の総需要量は原需要データと仮想的需要データとで異なっており、1日の総需要量の面からも仮想的需要データは秘匿性が高いものであることが確認された。
【0139】
続いて、本実施例では、本発明の共用データ生成方法によって生成された仮想的需要データが機器性能評価において有用性を有するものであることを確認するため、ヒートポンプ式給湯機のシミュレーションツールを用い、本発明の共用データ生成方法によって生成された仮想的需要データを用いた場合の性能評価結果と原需要データを用いた場合の性能評価結果とを比較した。
【0140】
本実施例では、定格出力4.5〔KW〕,エネルギー消費効率(仕事率)4.02,タンク容量300〔L〕,1日の放熱率8%のヒートポンプ式給湯機について、原需要データと仮想的需要データ(358日分を1セットとして10セット)との給湯機運転コスト及び湯切れ回数をシミュレーションツールを用いて調べた。なお、本実施例では、給湯機のシミュレーションツールとして、ヒートポンプ式給湯機の最適運転構成選択ツール(所・橋本・篠原,「ヒートポンプ式給湯機最適構成探索ツールの開発」,電中研研究報告R06018,2007年)を10分間隔の需要データにも使用し得ると共に最適な運転ルールを探索するように改良したものを用いた。
【0141】
本実施例では、シミュレーションツールに入力する給湯機需要データとして、比較元としての原需要データ1セットに加え、本発明の共用データ生成方法によって生成された仮想的需要データを10セット用いた。
【0142】
本実施例でのヒートポンプ式給湯機の運転ルールは以下の通りとした。
〈ルール1〉朝7時までに、至近1週間の7時から[h1]時間の総需要の最大値の[c1]倍を蓄熱する。
〈ルール2〉夕方17時に、至近1週間の17時から[h2]時間の総需要の最大値の[c2]倍を蓄熱する。
〈ルール3〉残湯量が[x1]kcalを下回ったら[x2]kcalになるまで沸き増す。
【0143】
上記運転ルールの各パラメータ(具体的には、h1,c1,h2,c2,x1,x2)は、原需要データと仮想的需要データ(第1セット)との各々で湯切れが生じず、各需要データの年間給湯運転コストの総和が最小になるように最適化したものを用いた。
【0144】
最適化の結果、原需要データを用いた場合の年間給湯運転コストは1万5千円であった。そして、本発明の共用データ生成方法によって生成された仮想的需要データ(10セット)それぞれを用いた場合の年間給湯機運転コストと原需要データを用いた場合の年間給湯機運転コストとの差を算出して図12に示す結果が得られた。
【0145】
図12から、運転コストの差の最大値は140円であり、原需要データを用い場合の年間給湯機運転コスト(=1万5千円)の1%以内であるので、本発明の共用データ生成方法によって生成された仮想的需要データは設備・機器性能評価に用いる上で支障がないことが確認された。
【0146】
仮想的需要データ(10セット)それぞれの年間給湯機運転コストの原需要データの場合との差の平均は6円であり、図12にも現れているように仮想的需要データそれぞれの原需要データの場合とのコスト差は正と負との両方の値をとり、偏りは小さいことが確認された。
【0147】
また、原需要データの場合とのコスト差が正と負との両方の値をとることから、図12に見られる給湯機運転コストの差は、対象需要家における給湯需要用途の発生時刻の違いなどにより生じる年間給湯機運転コストの揺らぎを反映していると考えられた。そして、このことから、本発明の共用データ生成方法によって生成された複数セットの仮想的需要データは、需要変動の影響を評価するためのデータとしても有効なデータになると考えられた。
【符号の説明】
【0148】
10 共用データ生成装置
17 共用データ生成プログラム
【特許請求の範囲】
【請求項1】
設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データを前記一定期間毎に前記単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する処理と、前記一定期間毎の前記複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを前記単位計測時間毎に足し合わせて前記一定期間毎の用途グループ需要値を算出する処理と、前記用途グループ毎に前記一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて前記一定期間の仮想的需要データを生成する処理とを有することを特徴とする共用データ生成方法。
【請求項2】
設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置と接続された装置であって、前記記憶装置から前記原需要データを読み込む手段と、前記原需要データを前記一定期間毎に前記単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段と、前記一定期間毎の前記複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを前記単位計測時間毎に足し合わせて前記一定期間毎の用途グループ需要値を算出する手段と、前記用途グループ毎に前記一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて前記一定期間の仮想的需要データを生成する手段とを有することを特徴とする共用データ生成装置。
【請求項3】
設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置にアクセス可能なコンピュータを、前記記憶装置から前記原需要データを読み込む手段、前記原需要データを前記一定期間毎に前記単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段、前記一定期間毎の前記複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを前記単位計測時間毎に足し合わせて前記一定期間毎の用途グループ需要値を算出する手段、前記用途グループ毎に前記一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて前記一定期間の仮想的需要データを生成する手段として機能させることを特徴とする共用データ生成プログラム。
【請求項1】
設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データを前記一定期間毎に前記単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する処理と、前記一定期間毎の前記複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを前記単位計測時間毎に足し合わせて前記一定期間毎の用途グループ需要値を算出する処理と、前記用途グループ毎に前記一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて前記一定期間の仮想的需要データを生成する処理とを有することを特徴とする共用データ生成方法。
【請求項2】
設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置と接続された装置であって、前記記憶装置から前記原需要データを読み込む手段と、前記原需要データを前記一定期間毎に前記単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段と、前記一定期間毎の前記複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを前記単位計測時間毎に足し合わせて前記一定期間毎の用途グループ需要値を算出する手段と、前記用途グループ毎に前記一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて前記一定期間の仮想的需要データを生成する手段とを有することを特徴とする共用データ生成装置。
【請求項3】
設備・機器若しくはエネルギーの単位計測時間当たりの実際の利用の程度を需要値として一定期間を区切りに計測された原需要データが保管されている記憶装置にアクセス可能なコンピュータを、前記記憶装置から前記原需要データを読み込む手段、前記原需要データを前記一定期間毎に前記単位計測時間当たりの需要値の大きさに基づいて複数の用途別の需要データに分解する手段、前記一定期間毎の前記複数の用途別の需要データにおける需要値が相互に関連して変動する複数の用途を用途グループとしてまとめると共に当該用途グループに含まれる前記複数の用途別の需要データを前記単位計測時間毎に足し合わせて前記一定期間毎の用途グループ需要値を算出する手段、前記用途グループ毎に前記一定期間毎の用途グループ需要値の中から無作為に抽出したものを足し合わせて前記一定期間の仮想的需要データを生成する手段として機能させることを特徴とする共用データ生成プログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2012−48620(P2012−48620A)
【公開日】平成24年3月8日(2012.3.8)
【国際特許分類】
【出願番号】特願2010−192214(P2010−192214)
【出願日】平成22年8月30日(2010.8.30)
【出願人】(000173809)財団法人電力中央研究所 (1,040)
【公開日】平成24年3月8日(2012.3.8)
【国際特許分類】
【出願日】平成22年8月30日(2010.8.30)
【出願人】(000173809)財団法人電力中央研究所 (1,040)
[ Back to top ]