【数据挖掘】时间序列预测-时间序列预测策略

单步预测和多步预测都是时间序列预测中常见的算法，根据其原理演化出了很多种优秀的算法，本节我们介绍四种非常实用的算法。

在做时间序列预测的时候，我们往往会预测未来多个时间步。但是，我们又没有未来的数据做训练，这时候就会引入一个概念：

举个例子：假设我们有10天的数据，现在要预测未来3天的数据。我们可以通过构造N阶滞后特征来实现这个目标。

已知序列：[1,2,3,4,5,6,7,8,9,10]，目标序列：[11,12,13]

单步预测：构造1阶滞后特征lag（t-1）作为训练数据，当前已知序列作为训练目标。下表中，绿色区域为训练过程，黄色区域为预测过程。当模型训练完成后，用第10天的数据可以预测第11天的数据，第11天预测第12天，第12天预测第13天。

在这里插入图片描述

多步预测：构造多输出模型，一次预测3个未来值。下图示例中input长度选取为3，实际应用中input长度通常远大于output长度。

在这里插入图片描述

参考文档：时间序列：多步预测的方法以及序列问题的分类

定义：直接多步预测(Direct Multi-Step Forecasting)，构建n个模型预测未来n个值，每个模型预测1个值。这种方法本质是一种单步预测法。

我们继续用之前的示例模型：已知序列：[1,2,3,4,5,6,7,8,9,10]，目标序列：[11,12,13]。

为了预测3个时间点的数值，我们需要构建3个模型，分别预测3个数值。

model1:[1,2,3,4,5,6,7,8,9,10],[11]，构建1阶滞后序列训练模型

model2:[1,2,3,4,5,6,7,8,9,10],[12]，构建2阶滞后序列训练模型

model3:[1,2,3,4,5,6,7,8,9,10],[13]，构建3阶滞后序列训练模型

3个模型的训练过程如下所示：

在这里插入图片描述

算法优点：

算法缺点：

参考文档：时间序列多步预测的五种策略

定义：递归多步预测(Recursive Multi-Step Forecasting)，用单个模型进行训练，通过使用模型已预测出的时间步的值作为输入，来预测下一个时间步的值，这个过程是递归进行的。

我们继续用之前的示例模型：已知序列：[1,2,3,4,5,6,7,8,9,10]，目标序列：[11,12,13]。

预测3个时间点的数值，我们只需构建1个模型，来递归预测3个未来数值。

当序列数据[8,9,10]预测出第11个数据值时，我们需要将这个预测值当做特征[9,10,11]去预测第12个数据。以此类推，递归迭代，直到预测过程全部完成。

模型的训练过程如下所示：

在这里插入图片描述

算法优点：

算法缺点：

递归多步预测的主要缺点是误差累积。由于它是基于之前步骤的预测结果来进行下一步的预测，因此任何一步的预测误差都会被带入到后续的预测中，导致误差的累积。随着预测步数的增加，误差累积效应会变得更加严重，从而影响预测结果的准确性。

定义：直接+递归的混合预测(Direct-Recursive Hybrid Forecasting)，结合直接策略和递归策略，构建n个模型预测未来n个值，但是每个模型都可以使用上一个模型预测出的结果继续预测。n个模型可以是同构的(相同的lag)，也可以是异构的(不同的lag)。

我们继续用之前的示例模型：已知序列：[1,2,3,4,5,6,7,8,9,10]，目标序列：[11,12,13]。

我们构建了3个模型（异构模型）。

model1（用1阶滞后特征训练），预测出的第11个点数值，作为model2（用2阶滞后特征训练）的训练数据，预测出的第12个点数值，作为model3（用3阶滞后特征训练）的训练数据，继续预测第13个点的数值。

在这里插入图片描述

算法优点：

直接多步预测方法虽然避免了递归方法中因使用预测值作为输入而导致的误差累积问题，但递归方法能够利用时间序列的相关性。混合预测方法通过结合两者的特性，可以在一定程度上减少误差累积，特别是在需要预测多个时间步长时。
递归方法通过利用前一个时间步的预测结果来预测下一个时间步，从而能够充分利用时间序列的相关性。混合预测方法保留了这一特性，使得预测结果更加准确。

算法缺点：