首页 > 代码库 > R语言与数据分析之九:HoltWinters指数平滑法
R语言与数据分析之九:HoltWinters指数平滑法
今天继续就指数平滑法中最复杂的一种时间序列:有增长或者降低趋势并且存在季节性波动的时间序列的预测算法即Holt-Winters和大家分享。这种序列可以被分解为水平趋势部分、季节波动部分,因此这两个因素应该在算法中有对应的参数来控制。
Holt-Winters算法中提供了alpha、beta和gamma 来分别对应当前点的水平、趋势部分和季节部分,参数的去执法范围都是0-1之间,并且参数接近0时,近期的观测值的影响权重就越小。我们以澳大利亚昆士兰州海滨纪念商品的月度销售日子为分析对象,老套路,咱先录入数据,并绘制出该时间序列,捞个整体印象:
souvenir <- scan("http://robjhyndman.com/tsdldata/data/fancy.dat") souvenirtimeseries <- ts(souvenir, frequency=12, start=c(1987,1)) logsouvenirtimeseries <- log(souvenirtimeseries) plot.ts(logsouvenirtimeseries)
我们采用R中提供的HoltWinters算法进行预测,实现和结果如下:
souvenirtimeseriesforecasts <- HoltWinters(logsouvenirtimeseries)
Alpha=0.4,意味着当期预测基于平衡了最近和较远期的观测值。Beta 为0表明趋势部分的斜率在整个时间序列上市不变的,且等于初始值,这个也符合我们的直观感受,水平改变非常多,但是趋势部分斜率是基本不变的,于此相反gamma=0.96表明当期季节部分预测仅仅基于最近的观测值。
我们同时画出预测值和观测值来看下预测的效果如何:
plot(souvenirtimeseriesforecasts)
可见Holt-Winters算法非常成功的预测了季节峰值,为了预测未来期数的值,我们同样采用forecast函数包,以预测未来48个月销售为例:
library("forecast") souvenirtimeseriesforecasts2 <- forecast.HoltWinters(souvenirtimeseriesforecasts, h=48) plot.forecast(souvenirtimeseriesforecasts2)
图中蓝色线条显示的为预测值,深灰色部分为80%的置信区间,浅灰色为95的置信区间。
接下来老套路采用Ljung-Box 和画出直方图来检查预测误差的随机性,就不重复贴代码了,有忘记的童鞋请转前两篇,我这里就直接贴结果图了:
三张图的结果表示咱们R提供的Holt-Winters()算法还是特别牛掰的,关于指数平滑就到此就彻底结束啦。
R语言与数据分析之九:HoltWinters指数平滑法