Excel 2016有一个叫“预测工作表”的功能,可以从历史数据中分析事物的未来趋势,并以图表的形式展现出来。有助于直观地观察事物的发展方向或趋势。
注:本体验以一个作者每月完成的体验次数为原始数据;当然也可以改成销售数字,让预测更有意义。
1.比如百度体验发布的某作者体验的数据,从2014年1月1日开始,到2016年4月1日结束。
2.确保活动单元格在数据表中,然后单击数据选项卡——预测组——预测工作表的按钮。
3.将弹出“创建预测工作表”向导窗口。该窗口为我们提供了历史数据和未来预测数据的图表,其中蓝色虚线是历史数据,橙色虚线是未来预测数据。可以看到,代表未来预测数据的橙色虚线基本是直的(线性或线性),还没有被正确预测。
4.这是因为没有设置正确的“季节性”参数。我们单击向导窗口左下角的“选项”按钮,查看更多预测参数。
5.将预测结束日期选择为2017年4月1日,将季节设置从自动检测更改为手动设置,并将其值设置为12。之所以会有这样的变化,是因为我们的原始数据是每个月用户发表的体验文章数量,数据范围是2014年1月到2016年4月,每期12个月;而且需要从上次数据(2016年4月)向后预测一年内的数据。
6.在向导窗口中单击确定,Excel将插入一个新的工作表,该工作表包含原始数据和三列预测数据:趋势预测、置信下限和置信上限。当然,它还包括一个预测图表。从图表中可以直观的看出,根据2014年和2015年的数据,这位体验作家每年的5月和10月都是体验创作的高峰期。因为这两个月有假期,所以基本可以确定这个作者是个好人。
7.为了进一步了解Excel数据预测工作表的运行机制,我们再来仔细看看其他选项。除了上面提到的“预测结束”和“季节设置”,Excel的预测工作表还有以下主要参数:
预测开始:从哪个期间的历史数据开始预测。
置信区间:设定预测值的上下限;值越小,上限和下限之间的范围越小。
通过以下方式填充缺失的插值点:“插值”是默认的,是根据数据的加权平均计算的插值;也可以设置为“0”,即不进行缺失值的插值计算。
用以下方法聚合重复项:以这次经历的数据为例。如果2015年4月有几个数据,Excel在计算预测值时会“聚合”一个月内的多个值。“聚合”的方法包括平均(默认)、计数、最大/最小/中值等。
8.以上面提到的“预测开始”为例。如果历史数据具有很强的周期性,可以将预测开始时间设置为早于最后一个历史数据,这样可以检验预测的准确性。提前到周期结束时的期间(如第二年的最后一个期间编号)也有助于提高预测的准确性。
我们将“预测开始”设定在2015年12月1日,这是第二个数据周期的最后一期。
可以看到,Excel预测的数据(橙色虚线)与2016年4个月的实际数据(蓝色虚线)基本一致,具有一定的预测精度。
9.Excel预测工作表的功能是基于一个名为forecast的函数实现的。ETS你可以通过百度了解这个功能的更多信息。
注意:历史数据的周期越多,预测的准确率越高。