説明

予測方法、予測装置、予測プログラムおよび記録媒体

【課題】
複数の予測データを指標を用いて加重平均して高精度の予測データとする予測方法、予測装置、予測プログラムおよび記録媒体を提供する。
【解決手段】
複数の予測モデルを構築する予測モデル構築手段20と、複数の予測モデルのうちの二個の予測モデルの類似度・非類似度に基づく指標を算出する指標算出手段60と、複数の予測モデルによる予測を行って複数の予測データを算出する予測実行手段70と、指標に基づいて類似度が小さい(非類似度が大きい)予測モデルの予測データの加重比率を大きく、また、類似度が大きい(非類似度が小さい)予測モデルの予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段80と、を有する予測装置とした。
また、予測モデル構築・指標算出・予測データ加工の各手順の予測方法、この予測方法による予測プログラム、この予測プログラムが記録された記録媒体とした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、計算機を利用した各種予測(電力需要、水需要、熱需要など各種の需要量についての需要量予測、販売量予測、価格予測、経済指標予測)を行うための予測方法、予測装置、予測プログラムおよび記録媒体に関する。
【背景技術】
【0002】
従来から様々な分野において、予測が行われている。例えば、電力会社では翌日の電力需要を予測して、その結果に基づき発電機の稼働を計画している。商店や自動販売機では販売量を予測し、商品を補充している。金融分野では、商品価格、株価、為替を予測し、様々なトレードを行っている。
このように、多くの分野において様々な予測が行われている。その予測方法としては、人間の勘に頼る方法、計算機で予測する方法などがあるが、予測対象や分野に決まった方法はなく、様々な手法が研究され、様々な方法が実用化されているのが現状である。
【0003】
予測システム構築の問題点は、予想対象や分野により決まった手法というものがなく、そのため予想手法を確立するために長時間のデータ分析やシミュレーション検証が必要なことである。そのため、予測システムの構築に時間がかかり、結果的にコストが高くなってしまったり、また、コスト削減のため十分なデータ分析やシミュレーション検証を行わないと、高い予測精度を持つシステムを構築することができなかった。
【0004】
また、予測に用いる予測モデルとして、線形予測モデルや非線形予測モデルが用いられる。代表的な線形予測モデルとしては重回帰手法を挙げることができ、また、代表的な非線形予測モデルとしてニューラルネットワークを挙げることができる。これらの予測モデルの構築にあたっては、一般的に多量のデータが必要である。仮に、少量のデータで予測モデルを構築すると、予測モデル構築に用いる学習データのばらつきによって、多量のデータを用いた場合に比べて、予測精度は悪化する。すなわち予測モデル構築に用いる学習データに対しては良く適合するが、未学習データに対しては誤差が大きくなる。
【0005】
このような問題点の解決法として、複数の予測手法をシステムに組み込む方法がある。つまり、候補となる予測手法を複数組み込むことで、1つの最良な予測手法に絞り込むための検討・検証時間を削減し、コストを削減するものである。もし、予測精度の高い予測手法を適切に選ぶことができるならば、結果的に高い予測結果を得ることができる。
【0006】
このような予測に係る従来技術として、例えば非特許文献1(「ニューラルネットワークを応用した電力需要予測システムの実用化、H15年度電気学会全国大会」)がある。この従来技術では、東北地方の翌日の電力需要を3つの予測手法(全店一括予測方式、負荷種別予測方式、過去実績値)を用いて予測し、運用者がその中の1つを選択し加工したものを最終的な予測値としている。また、そのうち2つの予測手法(全店一括予測方式、負荷種別予測方式)の予測結果および誤差指標を画面系にて確認している。
【0007】
また、予測に係る他の従来技術として、例えば特許文献1(特開平8−163778号公報、発明の名称「電力需要予測システム」)には、複数の予測用ニューラルネットワークを複数の不確定度推定ニューラルネットワークによりその誤差範囲を推定し、推定誤差範囲が最も小さいニューラルネットワークを予測値として選択するシステムが開示されている。
【0008】
また、予測に係る他の従来技術として、例えば特許文献2(特開2001−14295号、発明の名称「データ予測方法、データ予測装置および記録媒体」)には、複数の予測手法から1つ選択する発明について開示されている。
【0009】
【非特許文献1】葛根田哲也,石原徹,塚田英一,松井哲郎,飯坂達也,福山良和、“ニューラルネットワークを応用した電力需要予測システムの実用化”、平成15年度電気学会全国大会、2003/3/17〜19、仙台、第6分冊, p.88,p.89
【特許文献1】特開平8−163778号公報(段落番号0013〜0047)
【特許文献2】特開2001−14295号公報(段落番号0020〜0035)
【発明の開示】
【発明が解決しようとする課題】
【0010】
上記した非特許文献1の電力需要予測では、3つの予測手法を用意し、運用者が予測結果として信頼性が高いと思われる手法の予測値を任意に選択する方法がとられている。しかし、この方法でも、3つの予測値の中でいずれを採用すべきであるかを決める基準がなく、運用者の経験と勘に頼っているのが現状である。
【0011】
また、上記した特許文献1の従来技術(電力需要予測システム)では、複数の予測モデルから1つの予測モデルを選択する方法に関する発明であるが、各予測モデルごとに誤差推定用ニューラルネットワークを構築しなければならず、システムが複雑になる欠点がある。また、ニューラルネットワークはその構造上常に最適な学習ができる保証はないという問題がある(大域的最適解に収束できず、局所最適解に収束する問題がある)。つまり、n個ある予測モデルの中でi番目の予測モデルが最適であったとしても、n個ある誤差推定用ニューラルネットワーク全ての学習が最適でない場合には、i番目の予測モデルを適切に選択することはできない。n個全てのニューラルネットワークを最適に学習させることは理論上不可能に近いため、最適なi番目の予測モデルを選択することも困難である。簡単な例をあげれば、1番目の誤差推定用ニューラルネットワークの学習が不適切で常に誤差が0であると誤った出力をするものとする。その場合は、たとえ2〜n番目の誤差推定用ニューラルネットワークの学習が適切であったとしても、常に1番目の予測用モデルが選択され、i番目の予測モデルが選択されることはない。
【0012】
また、上記した特許文献2の従来技術(データ予測方法、データ予測装置および記録媒体)では、複数の予測手法から1つの予測手法を選択する方法であるが、予測結果はあらかじめ用意した予測手法のいずれかに限定される。つまり、n個の予測モデルを用意した場合には、n個の予測モデルから最良の1つを選択することができるが、選択候補がn個に限定されるため、高精度の予測結果を得たいときには、nの数を多くする必要がある。多くの予測手法を用意する場合には、それだけシステム化のコストが増加するという問題が生じる。
【0013】
上記の各手法は、基本的には複数の予測結果の中から、精度が良いものを選択するという方法である。従って、それぞれの予測手法の予測精度より良い精度の結果は得られない。すなわち、複数の予測手法の精度が全て悪い場合には、やはり悪い結果しか得られないことになる。
【0014】
そこで、一つの解決方法として、複数の異なった予測手法を用いて、誤差指標に基づいて複数の予測値を加重平均して予測値を加工する方法が考えられる。
複数の予測結果の加重平均を行う方法では、予測誤差に含まれるばらつきを減少させる効果がある。例えば、2つの予測結果AとBがあったとして、一方の予測誤差(A)がプラス側にずれており、もう一方の予測誤差(B)がマイナス側にずれているとしたら、両方の予測結果を平均することで、予測誤差を低減させることが可能となる。
【0015】
この場合、事前に予測誤差を知ることはできないため、過去の予測誤差傾向を用いて平均を行うことになる。ここで、過去の予測誤差傾向と、予測時点以降の誤差傾向と、が一致していれば、平均化の効果があると考えられる。すなわち、予測誤差Aが過去も将来もプラス側であって、予測誤差Bが過去も将来もマイナス側であれば、AとBの平均によって、予測精度は向上すると考えられる。
しかしながら、将来の予測誤差Aがプラス側であっても、将来の予測誤差Bもプラス側であれば、平均化の効果がなく、逆に精度が悪化してしまう場合も考えられる。すなわち、プラス側かマイナス側かといった過去の誤差傾向ではなく、各々の予測モデルがどのような予測傾向を示すのか、その特性をあらわす指標を用いる必要があるが、現状このような指標を算出する手法は存在していないという問題があった。
さらには上記の方法では、複数の異なる予測手法の利用が前提となっており、単一の予測手法には適用できないという問題があった。
【0016】
本発明は上記課題を解決するためになされたものであり、その目的は、予測モデルの特性(複数の予測モデル間の非類似度、類似度)や予測結果の特性(複数の予測結果間の非類似度、類似度、相関)に基づいて加重平均を行うことにより、予測結果の複数の手法を組み込んだ予測システムだけでなく、単一の予測手法を適用する場合においても、各予測データを加工することで、予測精度を高めるようにした予測方法、予測装置、予測プログラムおよび記録媒体を提供することにある。
【課題を解決するための手段】
【0017】
本発明の請求項1に係る予測方法は、
未来の予測に係る予測データを算出する予測方法であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手順と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手順と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手順と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手順と、
を有することを特徴とする。
【0018】
また、本発明の請求項2に係る予測方法は、
未来の予測に係る予測データを算出する予測方法であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手順と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手順と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手順と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手順と、
を有することを特徴とする。
【0019】
本発明の請求項3に係る予測装置は、
未来の予測に係る予測データを算出する予測装置であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
を有することを特徴とする。
【0020】
また、本発明の請求項4に係る予測装置は、
未来の予測に係る予測データを算出する予測装置であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
を有することを特徴とする。
【0021】
本発明の請求項5に係る予測プログラムは、
未来の予測に係る予測データを算出する予測プログラムであって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムであることを特徴とする。
【0022】
また、本発明の請求項6に係る予測プログラムは、
未来の予測に係る予測データを算出する予測プログラムであって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムであることを特徴とする。
【0023】
本発明の請求項7に係る記録媒体は、
未来の予測に係る予測データを算出する予測プログラムがコンピュータに読み取り可能に記録された記録媒体であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムを記録したことを特徴とする。
【0024】
また、本発明の請求項8に係る記録媒体は、
未来の予測に係る予測データを算出する予測プログラムがコンピュータに読み取り可能に記録された記録媒体であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムを記録したことを特徴とする。
【発明の効果】
【0025】
以上のような本発明によれば、予測モデルの特性(複数の予測モデル間の非類似度,類似度)や予測結果の特性(複数の予測結果間の非類似度,類似度,相関)に基づいて加重平均を行うことにより、予測結果の複数の手法を組み込んだ予測システムだけでなく、単一の予測手法を適用する場合においても、各予測データを加工して高精度の予測データとすることで、予測精度を高めるようにした予測方法、予測装置、予測プログラムおよび記録媒体を提供することができる。
【発明を実施するための最良の形態】
【0026】
以下、本発明の最良の形態の予測方法、予測装置、予測プログラムおよび記録媒体について図を参照しつつ説明する。
まず、予測モデルの非類似度を用いる予測方法について図を参照しつつ説明する。図1は本形態の予測方法を説明するフローチャートである。
【0027】
ステップS10は、過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する手順(予測モデル構築手順)である。予測モデルとしては、単一の予測手法、または、複数の異なる予測手法のどちらでも良い。単一の予測手法を用いる場合は、予測モデル構築用に蓄積された全てのデータを用いるのではなく、一部のデータをサンプリングして予測モデルを構築し、また、異なる条件でサンプリングして別の予測モデルを構築するなどの方法を適用することができる。
【0028】
ここで、予測手法の詳細については本発明の要旨ではないので詳細な説明は省略するが、代表的な予測モデルとしては、重回帰モデル、ニューラルネットワークモデル、ファジィ推論モデル、自己回帰モデル、カルマンフィルタモデル、事例ベース推論モデルなどがある。本形態では、予測モデルとしてニューラルネットワークモデルを採用した場合の予測手法について説明する。ニューラルネットワークモデルは様々な文献に記載されているため、簡単に説明するに留めるが、一般に入力層、中間層、出力層からなる3階層ニューラルネットワーク構造を有しており、さらに、入力層、中間層、出力層の各層にはシグモイド関数で表現されたニューロンによる素子が設けられ、入力層と中間層との素子間、中間層と出力層との素子間に結合を持つ。
【0029】
このニューラルネットワークでは入力層における素子が入力因子に、また、出力層における素子が出力因子に、それぞれ相当する。そしてニューロン間では結合の度合いを結合係数で表しており、この結合係数は、ニューラルネットワークの素子間の結合の重みを表すための係数である。結合係数が大きければ、結合が重みを有している、つまり、必要な結合であるとされ、結合係数が小さければ、結合が重みを有していない、つまり、不要な結合であるとされる。結合係数wの大きさを更新することで、入出力間の非線形関係を学習することができる。
【0030】
入力層素子数をn、中間層素子数をm、出力層素子数を1、入力層と中間層間の結合係数をwij、中間層と出力層間の結合係数をwj、入力をx=(x、x、x、・・・、x)とすると、入出力関係は以下の各式のように表される。中間層素子jへの入力は次式のようになる。
【0031】
【数1】

【0032】
また、中間層素子jの出力は次式のようになる。
【0033】
【数2】

【0034】
また、出力層素子への入力は次式のようになる。
【0035】
【数3】

【0036】
また、出力層素子の出力は次式のようになる。
【0037】
【数4】

【0038】
このようなニューラルネットワークモデルでは、モデル構造や結合係数を変更することで非線形の入出力関係を処理することができるため、予測モデルとして多用されている。
このようなニューラルネットワークの予測モデル構築とは、複数の入力層素子(入力因子)に入力された入力値(時系列データ)に対し、出力層素子(出力因子)から所望の出力値が得られるように入力層と中間層、また、中間層と出力層との結合係数を変更することをいう。これにより結合係数が確定するものとする。
【0039】
ステップS11は、複数の予測モデルのうちの二個の予測モデルの非類似度を表す指標を、全ての組み合わせについて算出する手順(指標算出手順)である。
ニューラルネットワークの場合、前記した入力層と中間層との結合係数、及び中間層と出力層との結合係数を用いて、予測モデルと他の予測モデルの非類似度を算出する。
【0040】
本形態の説明では、説明を具体的にするため、構造は同じであるが結合係数が相違するようなニューラルネットワークを3個用いるものとし、指標として非類似度を採用したものとする。ここに3個のニューラルネットワークの結合係数は次のように表される。
ニューラルネットワーク1の結合係数をw1=(w11、w21、w31、・・・、wn+m1)
ニューラルネットワーク2の結合係数をw2=(w12、w22、w32、・・・wn+m2)
ニューラルネットワーク3の結合係数をw3=(w13、w23、w33、・・・wn+m3)
【0041】
まず、ニューラルネットワーク1についての指標を計算する例を示す。ニューラルネットワーク1とニューラルネットワーク2との非類似度は、次式で表される。
【0042】
【数5】

【0043】
同様に、ニューラルネットワーク1とニューラルネットワーク3との非類似度は、次式で表される。
【0044】
【数6】

【0045】
このようにして算出された非類似度d12、d13から求められるニューラルネットワーク1の指標は、次式のように表される。
【0046】
【数7】

【0047】
この指標d1は、ニューラルネットワーク1と、他のニューラルネットワークとの結合係数の非類似度を表したものである。ちなみに、ニューラルネットワークがn個の場合は、ニューラルネットワーク1の指標は、次式のように表される。
【0048】
【数8】

【0049】
続いて、ニューラルネットワーク2についての指標を計算する例を示す。ニューラルネットワーク2とニューラルネットワーク1との非類似度は、次式で表される。
【0050】
【数9】

【0051】
同様に、ニューラルネットワーク2とニューラルネットワーク3との非類似度は、次式で表される。
【0052】
【数10】

【0053】
このようにして算出された非類似度d21、d23から求められるニューラルネットワーク2の指標は、次式のように表される。
【0054】
【数11】

【0055】
この指標dは、ニューラルネットワーク2と、他のニューラルネットワークとの結合係数の非類似度を表したものである。
続いて、ニューラルネットワーク3についての指標を計算する例を示す。ニューラルネットワーク3とニューラルネットワーク1との非類似度は、次式で表される。
【0056】
【数12】

【0057】
同様に、ニューラルネットワーク3とニューラルネットワーク2との非類似度は、次式で表される。
【0058】
【数13】

【0059】
このようにして算出された非類似度d31、d32から求められるニューラルネットワーク3の指標は、次式のように表される。
【0060】
【数14】

【0061】
この指標dは、ニューラルネットワーク3と、他のニューラルネットワークとの結合係数の非類似度を表したものである。
前述の非類似度による指標の算出においては、次式のように重み係数Rを用いてより一般化して表すことで、特定の結合係数を重視した非類似度を考慮することも可能である。
【0062】
【数15】

【0063】
なお、重み係数Rを用いる一般化は、d12の他にd13、d21、d23、d31、d32 なども採用するものである。
さて、予測モデルの特徴を表す指標として非類似度を取り上げ、他の予測モデルとの結合係数の二乗距離の例を記載したが、結合係数のマンハッタン距離や、結合係数の差、平均値などでも良い。
【0064】
ステップS12は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手順(予測実行手順)である。ここにある予測モデルiの予測結果である予測データをそれぞれR(i=1〜n)とする。
【0065】
ステップS13は、指標に基づいて非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、非類似度が小さい予測モデルによる予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手順(予測データ加工手順)である。最終的な予測結果である最終予測データRは、上記の指標d、d、dに基づいて算出される加重比率W(i=1〜n)、および、予測データR(i=1〜n)を用いて次式で表される。
【0066】
【数16】

【0067】
ここに、非類似度に基づいて算出される加重比率は次式で表される。
【0068】
【数17】

【0069】
このようにして算出した最終予測データでは特に非類似であるとされた予測モデルからの予測データに重く加重して加重平均がなされているため、例えば、各種要因により予測傾向が異なるような場合でも予測に組み入れて予測することができる。
予測モデルの非類似度を用いる予測方法はこのようなものである。
【0070】
続いて、予測モデルの非類似度に代えて、予測モデルの類似度を用いる予測方法について図を参照しつつ説明する。なお、この予測方法のフローチャートは図1と同じであり、図1を参照しつつ説明する。
ステップS10は、過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する手順(予測モデル構築手順である。予測モデルとしては、単一の予測手法、複数の異なる予測手法のどちらでも良い。単一の予測手法を用いる場合は、予測モデル構築用に蓄積された全てのデータを用いるのではなく、一部のデータをサンプリングして予測モデルを構築し、また、異なる条件でサンプリングして別の予測モデルを構築するなどの方法を適用することができる。
本形態でも具体例としてニューラルネットワークの予測モデル化を行うものとし、複数の入力層素子(入力因子)に入力された入力値(時系列データ)に対し、出力層素子(出力因子)から所望の出力値が得られるように入力層と中間層、また、中間層と出力層との結合係数を変更することをいう。これにより結合係数が確定するものとする。
【0071】
ステップS11は、複数の予測モデルのうちの二個の予測モデルの類似度を表す指標を、全ての組み合わせについて算出する手順(指標算出手順)である。
ニューラルネットワークの場合、前記した入力層と中間層の結合係数、及び中間層と出力層の結合係数を用いて、予測モデルと他の予測モデルの類似度を指標とする。
【0072】
本形態の説明でも、説明を具体的にするため、先の説明と同様に、構造は同じであるが結合係数が相違するようなニューラルネットワークを3個用いるものとし、類似度に基づく指標を算出するものとする。ここに3個のニューラルネットワークの結合係数は次のように表される。
ニューラルネットワーク1の結合係数をw1=(w11、w21、w31、・・・、wn+m1)
ニューラルネットワーク2の結合係数をw2=(w12、w22、w32、・・・wn+m2)
ニューラルネットワーク3の結合係数をw3=(w13、w23、w33、・・・wn+m3)
【0073】
まず、ニューラルネットワーク1についての指標を計算する例を示す。ニューラルネットワーク1とニューラルネットワーク2との類似度は、次式で表される。
【0074】
【数18】

【0075】
同様に、ニューラルネットワーク1とニューラルネットワーク3との類似度は、次式で表される。
【0076】
【数19】

【0077】
このようにして算出された類似度s12、s13から求められるニューラルネットワーク1の指標は、次式のように表される。
【0078】
【数20】

【0079】
この指標s1は、ニューラルネットワーク1と、他のニューラルネットワークとの結合係数の類似度を表したものである。なお、ニューラルネットワークがn個の場合は、ニューラルネットワーク1の指標は、次式のように表される。
【0080】
【数21】

【0081】
同様に、ニューラルネットワーク2についての指標を計算する例を示す。ニューラルネットワーク2とニューラルネットワーク1との類似度は、次式で表される。
【0082】
【数22】

【0083】
同様に、ニューラルネットワーク2とニューラルネットワーク3との類似度は、次式で表される。
【0084】
【数23】

【0085】
このようにして算出された類似度s21、s23から求められるニューラルネットワーク2の指標は、次式のように表される。
【0086】
【数24】

【0087】
この指標sは、ニューラルネットワーク2と、他のニューラルネットワークとの結合係数の類似度を表したものである。
同様に、ニューラルネットワーク3についての指標を計算する例を示す。ニューラルネットワーク3とニューラルネットワーク1との類似度は、次式で表される。
【0088】
【数25】

【0089】
同様に、ニューラルネットワーク3とニューラルネットワーク2との類似度は、次式で表される。
【0090】
【数26】

【0091】
このようにして算出された類似度s31、s32から求められるニューラルネットワーク3の指標は、次式のように表される。
【0092】
【数27】

【0093】
この指標sは、ニューラルネットワーク3と、他のニューラルネットワークとの結合係数の類似度を表したものである。
前述の類似度指標の算出においては、次式のように重み係数Rを用いて、より一般化して表すことで、特定の結合係数を重視した類似度を考慮することも可能である。
【0094】
【数28】

【0095】
なお、重み係数Rを用いる一般化は、s12の他に、s13、s21、s23、s31、s32 なども採用するものである。
さて、予測モデルの特徴を表す指標として類似度を取り上げ、他の予測モデルとの結合係数の二乗距離の例を記載したが、結合係数のマンハッタン距離や、結合係数の差、平均値などでも良い。また、類似度の場合は、予測モデルのパラメータ間の相関係数を用いるようにしてもよい。
【0096】
ステップS12は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手順(予測実行手順)である。ここにある予測モデルiの予測結果である予測データをそれぞれR(i=1〜n)とする。
【0097】
ステップS13は、指標に基づいて類似度が小さい予測データの加重比率を大きく、また、類似度が大きい予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手順(予測データ加工手順)である。最終的な予測結果である最終予測データRは、上記の指標s、s、sに基づいて算出される加重比率W(i=1〜n)、および、予測データR(i=1〜n)を用いて次式で表される。
【0098】
【数29】

【0099】
ここに、類似度に基づいて算出される加重比率は次式で表される。
【0100】
【数30】

【0101】
このようにして算出した最終予測データでは特に類似でないとされた予測モデルからの予測データに重く加重して加重平均がなされているため、例えば、各種要因により予測傾向が異なるような場合でも予測に組み入れて予測することができる。
予測モデルの類似度を用いる予測方法はこのようなものである。
【0102】
続いて、このような予測を行う予測装置について図を参照しつつ説明する。図2は、本形態の予測装置である。予測装置は、データ入力手段10と、予測モデル構築手段20と、データ出力手段30と、データ保存手段40と、中央処理部50とを備えている。中央処理部50はさらに指標算出手段60と、予測実行手段70と、予測データ加工手段80と、を備えている。
【0103】
データ入力手段10は、キーボード、または、LAN・インターネットなどの通信装置で構成され、予測に必要な実績データ、カレンダデータ、パラメータを入力するための手段である。
予測モデル構築手段20は、例えばニューラルネットワークモデルに学習させて予測モデルを構築する手段である。この手段は、例えば、他のコンピュータまたは中央処理部50が、予め予測モデル構築手段20と機能して、データ保存手段40に構築後の予測モデルを表すデータ(定数や数式)を登録するものである。例えば、ニューラルネットワークモデルなら上記数式や入力層素子数、中間層素子数、出力層素子およびこれら入力層−中間層素子間や中間層−出力層素子間の重み係数、素子の入出力関係を表す関数等が登録される。
【0104】
データ出力手段30は、ディスプレイ、伝送装置、プリンタにより構成されており、最終的な予測結果である最終予測データや、各予測手法の予測結果の表示や伝送、また予測途中で算出された各種計算結果を表示したり、または、伝送する手段である。
データ保存手段40は、ハードディスク、光磁気ディスク、フロッピー(登録商標)ディスク、メモリで構成され、入力された実績データ、カレンダデータ、パラメータ、予測モデルを保存する手段である。また予測途中で算出された各種計算結果を保存する。
【0105】
中央処理部50は、上述したような指標算出手順、予測実行手順、予測データ加工手順を含む予測プログラムを搭載しており、データ保存手段40から実績データ、カレンダデータ、パラメータを読み出し、指標算出手段60と、予測実行手段70と、予測データ加工手段80として機能して演算処理し、最終予測データをデータ保存手段40に書き込む手段である。
【0106】
指標算出手段60は、複数の予測モデルのうちの二個の予測モデルの非類似度または類似度を表す指標を、全ての組み合わせについて算出する手段である。
予測実行手段70は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手段である。ここにある予測モデルiの予測結果である予測データをそれぞれR(i=1〜n)とする。ここで、各予測手段1〜nの代表的な予測手法としては、重回帰式、ニューラルネットワーク、ファジィ推論、自己回帰モデルなどがある。
【0107】
予測データ加工手段80とは、指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手段である。最終予測データは、上記数16,数29のようになる。
【0108】
このような予測装置の動作について説明する。予測装置では、予めデータ入力手段10を通じて予測に必要な実績データ・カレンダデータ・パラメータをデータ保存手段40に登録しておく。また、モデル構築手段20から定数や数式という予測モデルを表すデータをデータ保存手段40に登録しておく。そして予測装置が予測する場合、まず、中央処理部50が実績データ・カレンダデータ・パラメータ等予測に必要なデータおよび予測モデルを表すデータを読み出して図示しない記憶部に一時的に記憶させる読み出し手段として機能する。続いて、中央処理部50が上記のように複数の予測モデルから、ある予測モデルと、他の予測モデルとの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段60として機能する。続いて中央処理部50がn種類の予測データを算出する予測実行手段70として機能する。続いて、中央処理部50は、指標に基づいてn種類の予測データの加重平均を算出し、最終予測データとして算出する予測データ加工手段80として機能する。続いて、中央処理部50は、算出した予測データをデータ保存手段40に書き込む書き込み手段として機能する。最終的に中央処理部50は、データ保存手段40から予測データをデータ出力手段30を介して出力させる出力手段として機能する。
【0109】
本形態の予測装置はこのようにして予測することとなる。なお、本発明は上記に示す装置構成に限定されるものではなく、例えば、データ入力手段10と、予測モデル構築手段20と、データ出力手段30と、データ保存手段40と、中央処理部50と、を含む一台のコンピュータとしても良い。中央処理部50が指標算出手段60と、予測実行手段70と、予測データ加工手段80として機能すれば、一台のコンピュータにより予測を行わせることができる。
【0110】
また、予測プログラムは、予測装置の中央処理部50を、予測モデル構築手段20と、指標算出手段60と、予測実行手段70と、予測データ加工手段80として機能させるプログラムであり、中央処理部50に接続される記憶部(図示せず)に記憶されている。このような予測プログラムが記録された記録媒体(例えば、CD−ROM、MO、FD、HDというような磁気、光、光磁気により記録再生される媒体)を用いて予測装置に予測プログラムをインストールしてもよく、また、インターネット等のネットワーク・LAN(図示せず)を介して予測装置の記憶部(図示せず)に予測プログラムをインストールするようにしても良い。
【0111】
さて、このように予測モデルの非類似度・類似度を用いる予測方法は、利用する複数の予測モデルの構造が同じ場合に適用できる手法であったが、構造が異なる複数の予測モデルを利用する場合は、以下に示す予測データの非類似度・類似度を用いて予測することができる。
【0112】
続いて、予測モデルの非類似度・類似度に代えて、予測データの非類似度を用いる予測方法について図を参照しつつ説明する。図3は他の形態の予測方法を説明するフローチャートである。
ステップS20は、過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する手順(予測モデル構築手順)である。予測モデルとしては、単一の予測手法、複数の異なる予測手法のどちらでも良い。単一の予測手法を用いる場合は、予測モデル構築用に蓄積された全てのデータを用いるのではなく、一部のデータをサンプリングして予測モデルを構築し、また、異なる条件でサンプリングして別の予測モデルを構築するなどの方法を適用することができる。
本形態でも具体例としてニューラルネットワークの予測モデル化を行うものとし、複数の入力層素子(入力因子)に入力された入力値(時系列データ)に対し、出力層素子(出力因子)から所望の出力値が得られるように入力層と中間層、また、中間層と出力層との結合係数を変更することをいう。これにより結合係数が確定するものとする。
【0113】
ステップS21は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手順(予測実行手順)である。過去の各予測モデルによる予測結果が、どの程度類似しているかを表す指標を算出する。予測期間をt=1〜Tとすると、ここに3個のニューラルネットワークからの予測データは次のように表される。なお、この予測期間(t=1〜T)は任意に選定可能である。
ニューラルネットワーク1からの予測データをr1=(r11、r21、r31、・・・、r1)
ニューラルネットワーク2からの予測データをr2=(r12、r22、r32、・・・r2)
ニューラルネットワーク3からの予測データをr3=(r13、r23、r33、・・・r3)
【0114】
ステップS22は、複数の予測データのうちの二個の予測データの非類似度を表す指標を、全ての組み合わせについて算出する手順(指標算出手順)である。
まず、ニューラルネットワーク1の予測データについての指標を計算する例を示す。ニューラルネットワーク1とニューラルネットワーク2との予測データの非類似度は、次式で表される。
【0115】
【数31】

【0116】
同様に、ニューラルネットワーク1とニューラルネットワーク3との予測データの非類似度は、次式で表される。
【0117】
【数32】

【0118】
このようにして算出された非類似度d12、d13から求められるニューラルネットワーク1の指標は、次式のように表される。
【0119】
【数33】

【0120】
この指標d1は、ニューラルネットワーク1と、他のニューラルネットワークとの出力の非類似度を表したものである。ちなみに、ニューラルネットワークがn個の場合は、ニューラルネットワーク1の指標は、次式のように表される。
【0121】
【数34】

【0122】
同様に、ニューラルネットワーク2についての指標を計算する例について示す。ニューラルネットワーク2とニューラルネットワーク1との予測データの非類似度は、次式で表される。
【0123】
【数35】

【0124】
同様に、ニューラルネットワーク2とニューラルネットワーク3との予測データとの非類似度は、次式で表される。
【0125】
【数36】

【0126】
このようにして算出された非類似度d21、d23から求められるニューラルネットワーク2の指標は、次式のように表される。
【0127】
【数37】

【0128】
この指標dは、ニューラルネットワーク2と、他のニューラルネットワークとの出力の非類似度を表したものである。
続いて、ニューラルネットワーク3についての指標を計算する例について示す。ニューラルネットワーク3とニューラルネットワーク1との予測データの非類似度は、次式で表される。
【0129】
【数38】

【0130】
同様に、ニューラルネットワーク3とニューラルネットワーク2との予測データの非類似度は次式で表される。
【0131】
【数39】

【0132】
このようにして算出された非類似度d31、d32から求められるニューラルネットワーク3の指標は、次式のように表される。
【0133】
【数40】

【0134】
この指標dは、ニューラルネットワーク3と、他のニューラルネットワークとの出力の非類似度を表したものである。
前述の非類似度指標の算出においては、次式のように重み係数Rを用いて、より一般化して表すことで、特定の結合係数を重視した非類似度を考慮することが可能である。
【0135】
【数41】

【0136】
なお、重み係数Rを用いる一般化は、d12の他に、d13、d21、d23、d31、d32 なども採用するものである。
さて、予測データの特徴を表す指標として非類似度を取り上げ、他の予測データとの結合係数の二乗距離の例を記載したが、結合係数のマンハッタン距離や、結合係数の差、平均値などでも良い。
【0137】
ステップS23は、指標に基づいて非類似度が大きい予測データの加重比率を大きく、また、非類似度が小さい予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手順(予測データ加工手順)である。
先のステップS21の予測実行手順で算出した予測データ、上記の指標d、d、dに基づいて算出される加重比率W(i=1〜n)、および、予測データR(i=1〜n)を用いて、最終的な予測結果である最終予測データR(予測期間がTより長い期間経過後の予測結果)は、次式で表される。
【0138】
【数42】

【0139】
ここに、非類似度に基づいて算出される加重比率は次式で表される。
【0140】
【数43】

【0141】
このようにして算出した最終予測データでは特に非類似であるとされた予測データに重く加重して加重平均がなされているため、例えば、各種要因により予測傾向が異なるような場合でも予測に組み入れて予測することができる。
予測データの非類似度を用いる予測方法はこのようなものである。
【0142】
続いて、予測データの類似度を用いる予測方法について図2の他の形態の予測方法を説明するフローチャートを参照しつつ説明する。
ステップS20は、過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する手順(予測モデル構築手順)である。予測モデルとしては、単一の予測手法、複数の異なる予測手法のどちらでも良い。単一の予測手法を用いる場合は、予測モデル構築用に蓄積された全てのデータを用いるのではなく、一部のデータをサンプリングして予測モデルを構築し、また、異なる条件でサンプリングして別の予測モデルを構築するなどの方法を適用することができる。
本形態でも具体例としてニューラルネットワークの予測モデル化を行うものとし、複数の入力層素子(入力因子)に入力された入力値(時系列データ)に対し、出力層素子(出力因子)から所望の出力値が得られるように入力層と中間層、また、中間層と出力層との結合係数を変更することをいう。これにより結合係数が確定するものとする。
【0143】
ステップS21は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手順(予測実行手順)である。過去の各予測モデルによる予測結果が、どの程度類似しているかを表す指標を算出する。予測期間をt=1〜Tとするとここに3個のニューラルネットワークからの予測データは次のように表される。
ニューラルネットワーク1からの予測データをr1=(r11、r21、r31、・・・、r1)
ニューラルネットワーク2からの予測データをr2=(r12、r22、r32、・・・r2)
ニューラルネットワーク3からの予測データをr3=(r13、r23、r33、・・・r3)
【0144】
ステップS22は、複数の予測データのうちの二個の予測データの類似度を表す指標を、全ての組み合わせについて算出する手順(指標算出手順)である。
まず、ニューラルネットワーク1の予測データについての指標を計算する例を示す。ニューラルネットワーク1とニューラルネットワーク2との予測データの類似度は、次式で表される。
【0145】
【数44】

【0146】
同様に、ニューラルネットワーク1とニューラルネットワーク3との予測データの類似度は、次式で表される。
【0147】
【数45】

【0148】
このようにして算出された類似度s12、s13から求められるニューラルネットワーク1の指標は、次式のように表される。
【0149】
【数46】

【0150】
この指標s1は、ニューラルネットワーク1と、他のニューラルネットワークとの出力の類似度を表したものである。ちなみに、ニューラルネットワークがn個の場合は、ニューラルネットワーク1の指標は、次式のように表される。
【0151】
【数47】

【0152】
同様に、ニューラルネットワーク2についての指標を計算する例を示す。ニューラルネットワーク2とニューラルネットワーク1との予測データの類似度は、次式で表される。
【0153】
【数48】

【0154】
同様に、ニューラルネットワーク2とニューラルネットワーク3との予測データの類似度は、次式で表される。
【0155】
【数49】

【0156】
このようにして算出された類似度s21、s23から求められるニューラルネットワーク2の指標は、次式のように表される。
【0157】
【数50】

【0158】
この指標sは、ニューラルネットワーク2と、他のニューラルネットワークとの出力の類似度を表したものである。
続いて、ニューラルネットワーク3についての指標を計算する例を示す。ニューラルネットワーク3とニューラルネットワーク1との予測データの類似度は、次式で表される。
【0159】
【数51】

【0160】
同様に、ニューラルネットワーク3とニューラルネットワーク2との予測データの類似度は、次式で表される。
【0161】
【数52】

【0162】
このようにして算出された類似度s31、s32から求められるニューラルネットワーク3の指標は、次式のように表される。
【0163】
【数53】

【0164】
この指標sは、ニューラルネットワーク3と、他のニューラルネットワークとの出力の類似度を表したものである。
前述の類似度指標の算出においては、次式のような重み係数Rを用いて、より一般化して表すことで、特定の結合係数を重視した類似度を考慮することが可能である。
【0165】
【数54】

【0166】
なお、重み係数Rを用いる一般化は、s12の他に、s13、s21、s23、s31、s32 なども採用するものである。
さて、予測モデルの特徴を表す指標として類似度を取り上げ、他の予測モデルとの結合係数の二乗距離の例を記載したが、結合係数のマンハッタン距離や、結合係数の差、平均値などでも良い。また、類似度の場合は、予測モデルのパラメータ間の相関係数を用いるようにしてもよい。
【0167】
ステップS23は、指標に基づいて類似度が小さい予測データの加重比率を大きく、また、類似度が大きい予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手順(予測データ加工手順)である。
先のステップS21の予測実行手順で算出した予測データ、上記の指標s、s、sに基づいて算出される加重比率W(i=1〜n)、および、予測データR(i=1〜n)を用いて、最終的な予測結果である最終予測データR(予測期間がTより長い期間経過後の予測結果)は次式で表される。
【0168】
【数55】

【0169】
ここに、類似度に基づいて算出される加重比率は次式で表される。
【0170】
【数56】

【0171】
このようにして算出した最終予測データでは特に類似していないとされた予測データに重く加重して加重平均がなされているため、例えば、各種要因により予測傾向が異なるような場合でも予測に組み入れて予測することができる。
予測データの類似度を用いる予測方法はこのようなものである。
【0172】
続いて、予測装置について図を参照しつつ説明する。図4は、他の形態の予測装置である。予測装置は、データ入力手段10と、予測モデル構築手段20と、データ出力手段30と、データ保存手段40と、中央処理部100とを備えている。中央処理部100はさらに予測実行手段110と、指標算出手段120と、予測データ加工手段130と、を備えている。
【0173】
本形態の予測装置ではデータ入力手段10、予測モデル構築手段20、データ出力手段30、データ保存手段40は先に説明した予測装置と同様の構成を採用しているため、重複する説明を省略するものとし、相違する中央処理部100について説明する。中央処理部100は、上述したような予測実行手順、指標算出手順、予測データ加工手順を含む予測プログラムを搭載しており、データ保存手段40から実績データ、カレンダデータ、パラメータを読み出し、予測実行手段110と、指標算出手段120と、予測データ加工手段130として機能して演算処理し、最終予測データをデータ保存手段40に書き込む手段である。
【0174】
予測実行手段110は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手段である。ここにある予測モデルiの予測結果である予測データをそれぞれR(i=1〜n)とする。ここで、各予測手段1〜nの代表的な予測手法としては、重回帰式、ニューラルネットワーク、ファジィ推論、自己回帰モデルなどがある。
【0175】
指標算出手段120は、複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する手段である。
予測データ加工手段130とは、指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手段である。最終予測データは、上記数42,数55のようになる。
【0176】
このような予測装置の動作について説明する。予測装置では、予めデータ入力手段10を通じて予測に必要な実績データ・カレンダデータ・パラメータをデータ保存手段40に登録しておく。また、モデル構築手段20から定数や数式という予測モデルを表すデータをデータ保存手段40に登録しておく。そして予測装置が予測する場合、まず、中央処理部100が実績データ・カレンダデータ・パラメータ等予測に必要なデータおよび予測モデルを表すデータを読み出して図示しない記憶部に一時的に記憶させる読み出し手段として機能する。続いて、中央処理部100が上記のように複数の予測モデル全てを用いて予測を行ってn種類の予測データを算出する予測実行手段110として機能する。続いて中央処理部100が数の予測データのうちの二個の予測データを用いて類似度または非類似度に基づく指標を、全ての組み合わせについて算出する指標算出手段120として機能する。続いて、中央処理部100は、指標に基づいてn種類の予測データの加重平均を算出し、最終予測データとして算出する予測データ加工手段130として機能する。続いて、中央処理部100は、算出した予測データをデータ保存手段40に書き込む書き込み手段として機能する。最終的に中央処理部100は、データ保存手段40から予測データをデータ出力手段30を介して出力させる出力手段として機能する。
【0177】
本形態の予測装置はこのようにして予測することとなる。なお、本発明は上記に示す装置構成に限定されるものではなく、例えば、データ入力手段10と、予測モデル構築手段20と、データ出力手段30と、データ保存手段40と、中央処理部100と、を含む一台のコンピュータとしても良い。中央処理部100が、指標算出手段110と、予測実行手段120と、予測データ加工手段130として機能すれば、一台のコンピュータにより予測を行わせることができる。
【0178】
また、予測プログラムは、予測装置の中央処理部100を、予測モデル構築手段20、指標算出手段110と、予測実行手段120と、予測データ加工手段130として機能させるプログラムであって、中央処理部100に接続される記憶部(図示せず)に記憶されている。このような予測プログラムが記録された記録媒体(例えば、CD−ROM、MO、FD、HDというような磁気、光、光磁気により記録再生される媒体)を用いて予測装置に予測プログラムをインストールしてもよく、また、インターネット等のネットワーク・LAN(図示せず)を介して予測装置の記憶部(図示せず)に予測プログラムをインストールするようにしても良い。
【0179】
以上これら予測モデルの類似・非類似、または予測データの類似・非類似を用いて、加重平均を行うようにしたため、各予測データを加工して高精度の予測データとすることで、予測精度を高めるようにすることができる。
【実施例1】
【0180】
続いて本発明の実施例1について図を参照しつつ説明する。本実施例1では予測モデルの非類似度を用いて加重平均を行う例である。図5は予測モデルの具体例を説明する説明図である。
この実施例1では、予測モデルであるニューラルネットワークの結合係数から非類似度による指標を算出し、加重平均を求めるものであり、図1も参照して説明する。
【0181】
図1のステップS10は、過去のデータを用いて、同一の予測手法であるニューラルネットワークによる複数の予測モデルを構築する手順(予測モデル構築手順)である。図5(a),(b),(c)で示すように、ニューラルネットワーク予測モデルを3個用いるものとする。図5(a)で示すニューラルネットワーク1、図5(b)で示すニューラルネットワーク2、図5(c)で示すニューラルネットワーク3の結合係数はそれぞれ以下のようになる。
ニューラルネットワーク1の結合係数w1=(1、2、3、4、5、6)、
ニューラルネットワーク2の結合係数w2=(1、2、3、4、5、1)、
ニューラルネットワーク3の結合係数w3=(1.2、2、3、4、5、6)
【0182】
ステップS11は、複数の予測モデルのうちの二個の予測モデルの非類似度を表す指標を、全ての組み合わせについて算出する手順(指標算出手順)である。
ニューラルネットワークの場合、前記した入力層と中間層の結合係数、及び中間層と出力層の結合係数を用いて、予測モデルと他の予測モデルの非類似度を表す指標とする。
【0183】
まず、ニューラルネットワーク1についての指標を計算する例を示す。ニューラルネットワーク1とニューラルネットワーク2との非類似度は、次式で表される。
【0184】
【数57】

【0185】
同様に、ニューラルネットワーク1とニューラルネットワーク3との非類似度は、次式で表される。
【0186】
【数58】

【0187】
このようにして算出された非類似度d12、d13から求められるニューラルネットワーク1の指標は、次式のように表される。
【0188】
【数59】

【0189】
続いて、ニューラルネットワーク2についての指標を計算する例を示す。ニューラルネットワーク2とニューラルネットワーク1との非類似度は、次式で表される。
【0190】
【数60】

【0191】
同様に、ニューラルネットワーク2とニューラルネットワーク3との非類似度は、次式で表される。
【0192】
【数61】

【0193】
このようにして算出された非類似度d21、d23から求められるニューラルネットワーク2の指標は、次式のように表される。
【0194】
【数62】

【0195】
この指標dは、ニューラルネットワーク2と、他のニューラルネットワークとの結合係数の非類似度を表したものである。
続いて、ニューラルネットワーク3についての指標を計算する例を示す。ニューラルネットワーク3とニューラルネットワーク1との非類似度は、次式で表される。
【0196】
【数63】

【0197】
同様に、ニューラルネットワーク3とニューラルネットワーク2との非類似度は、次式で表される。
【0198】
【数64】

【0199】
このようにして算出された非類似度d31、d32から求められるニューラルネットワーク3の指標は、次式のように表される。
【0200】
【数65】

【0201】
ステップS12は、複数の予測モデル全てを用いて予測を行って複数の予測データを算出する手順(予測実行手順)である。ここにある予測モデルiの予測結果である予測データをそれぞれRi(R1=10、R2=5、R3=11)になったものとする。
【0202】
ステップS13は、指標に基づいて非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、非類似度が小さい予測モデルによる予測データの加重比率を小さくし、このような加重比率により加重平均して最終予測データを算出する手順(予測データ加工手順)である。最終的な予測結果を表す最終予測データRは、上記の指標d、d、dに基づいて算出される加重比率W(i=1〜n)、および、予測データR(i=1〜n)を用いて次式で表される。
【0203】
【数66】

【0204】
ここに、非類似度に基づいて算出される加重比率は次式で表される。
【0205】
【数67】

【0206】
ニューラルネットワーク1についての加重比率は次式のようになる。
【0207】
【数68】

【0208】
ニューラルネットワーク2についての加重比率は次式のようになる。
【0209】
【数69】

【0210】
ニューラルネットワーク3についての加重比率は次式のようになる。
【0211】
【数70】

【0212】
各予測結果は上記のようにRi(R1=10、R2=5、R3=11)であり、最終的な予測結果Rは以下に示すようになる。
【0213】
【数71】

【0214】
このようにして算出した最終予測データRでは特に非類似であるとされた予測モデルからの予測データに重く加重して加重平均がなされているため、例えば、各種要因により予測傾向が異なるような場合でも予測に組み入れて予測することができる。本実施例1では、ニューラルネットワーク2は、他の2つのモデルと特性が大きく異なっているため、大きい加重比率になっていることが分かる。
【0215】
以上本発明の最良形態・実施例について説明した。本発明を用いることにより、予測システムの構築時間を短縮しコスト削減を実現することができる。また高い予測精度の予測値を得ることが可能である。従来は、1つの予測対象に1つの予測手法を実装するのが普通であった。少しでも精度の高い予測手法を実装するため、非常に長いデータ分析や複数の予測手法から1つの予測手法を絞り込むための検証、もしくは新しい予測手法を開発するための長い開発期間が必要であり、これらがシステム開発時のコスト増加の原因になっている。これを解決する従来手法として、1つの予測手法に限定せず複数の予測手法を実装する方法がある。この方法は、データ分析期間や、手法選定期間を短縮することが可能であり、開発期間短縮によりコスト削減が可能である。しかしながら、この方法でも複数の予測値からいずれの予測値を採用すればよいか選択する基準がない。本発明では、複数の予測値を選択・加工することにより1つの予測値を得ることができるため、開発期間の短縮によるコストダウン、予測精度の高精度化が同時に実現可能である。
本発明では、予測モデルの特性の非類似度(類似度)という指標、また、予測データの誤差の全体的な傾向の非類似度(類似度)を指標とすることによって、至近の予測誤差傾向が予測時点以降の傾向と異なる場合でも精度良い加重平均を可能とする方法である。
【図面の簡単な説明】
【0216】
【図1】本発明を実施するための最良の形態の予測方法を説明するフローチャートである。
【図2】本発明を実施するための最良の形態の予測装置の構成図である。
【図3】他の形態の予測方法を説明するフローチャートである。
【図4】他の形態の予測装置の構成図である。
【図5】予測モデルの具体例を説明する説明図である。
【符号の説明】
【0217】
10:データ入力手段
20:予測モデル構築手段
30:データ出力手段
40:データ保存手段
50:中央処理部
60:指標算出手段
70:予測実行手段
80:予測データ加工手段
100:中央処理部
110:予測実行手段
120:指標算出手段
130:予測データ加工手段

【特許請求の範囲】
【請求項1】
未来の予測に係る予測データを算出する予測方法であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手順と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手順と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手順と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手順と、
を有することを特徴とする予測方法。
【請求項2】
未来の予測に係る予測データを算出する予測方法であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手順と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手順と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手順と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手順と、
を有することを特徴とする予測方法。
【請求項3】
未来の予測に係る予測データを算出する予測装置であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
を有することを特徴とする予測装置。
【請求項4】
未来の予測に係る予測データを算出する予測装置であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
を有することを特徴とする予測装置。
【請求項5】
未来の予測に係る予測データを算出する予測プログラムであって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムであることを特徴とする予測プログラム。
【請求項6】
未来の予測に係る予測データを算出する予測プログラムであって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムであることを特徴とする予測プログラム。
【請求項7】
未来の予測に係る予測データを算出する予測プログラムがコンピュータに読み取り可能に記録された記録媒体であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデルのうちの二個の予測モデルの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測モデルによる予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測モデルによる予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムを記録したことを特徴とする記録媒体。
【請求項8】
未来の予測に係る予測データを算出する予測プログラムがコンピュータに読み取り可能に記録された記録媒体であって、
過去のデータを用いて、同一の予測手法による複数の予測モデル、または、異なった予測手法による複数の予測モデルを構築する予測モデル構築手段と、
複数の予測モデル全てを用いて予測を行って複数の予測データを算出する予測実行手段と、
複数の予測データのうちの二個の予測データの類似度または非類似度を表す指標を、全ての組み合わせについて算出する指標算出手段と、
指標に基づいて類似度が小さいまたは非類似度が大きい予測データの加重比率を大きく、また、類似度が大きいまたは非類似度が小さい予測データの加重比率を小さくし、該加重比率により加重平均して最終予測データを算出する予測データ加工手段と、
としてコンピュータに機能させるプログラムを記録したことを特徴とする記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2006−221310(P2006−221310A)
【公開日】平成18年8月24日(2006.8.24)
【国際特許分類】
【出願番号】特願2005−32720(P2005−32720)
【出願日】平成17年2月9日(2005.2.9)
【出願人】(000005234)富士電機ホールディングス株式会社 (3,146)