【数据挖掘】时间序列预测-时间序列预测策略

时间序列预测策略

      • (1)单步预测与多步预测
      • (2)直接多步预测
      • (3)递归多步预测
      • (4)直接+递归的混合预测
      • (5)多输入多输出预测

(1)单步预测与多步预测

  • 单步预测:每次预测时,输入窗口仅预测未来一个值。

  • 多步预测:每次预测时,输入窗口预测未来n个值(也叫n步)。

单步预测和多步预测都是时间序列预测中常见的算法,根据其原理演化出了很多种优秀的算法,本节我们介绍四种非常实用的算法。

在做时间序列预测的时候,我们往往会预测未来多个时间步。但是,我们又没有未来的数据做训练,这时候就会引入一个概念:

  • N阶滞后特征:训练和预测数据用到了N天之前的数据特征

举个例子:假设我们有10天的数据,现在要预测未来3天的数据。我们可以通过构造N阶滞后特征来实现这个目标。

已知序列:[1,2,3,4,5,6,7,8,9,10],目标序列:[11,12,13]

单步预测:构造1阶滞后特征lag(t-1)作为训练数据,当前已知序列作为训练目标。下表中,绿色区域为训练过程,黄色区域为预测过程。当模型训练完成后,用第10天的数据可以预测第11天的数据,第11天预测第12天,第12天预测第13天。

在这里插入图片描述

多步预测:构造多输出模型,一次预测3个未来值。下图示例中input长度选取为3,实际应用中input长度通常远大于output长度。

在这里插入图片描述

参考文档:时间序列:多步预测的方法以及序列问题的分类

(2)直接多步预测

定义:直接多步预测(Direct Multi-Step Forecasting),构建n个模型预测未来n个值,每个模型预测1个值。这种方法本质是一种单步预测法。

我们继续用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目标序列:[11,12,13]。

为了预测3个时间点的数值,我们需要构建3个模型,分别预测3个数值。

model1:[1,2,3,4,5,6,7,8,9,10],[11],构建1阶滞后序列训练模型

model2:[1,2,3,4,5,6,7,8,9,10],[12],构建2阶滞后序列训练模型

model3:[1,2,3,4,5,6,7,8,9,10],[13],构建3阶滞后序列训练模型

3个模型的训练过程如下所示:

在这里插入图片描述

算法优点:

  • 直接多步预测能够直接预测未来的多个步骤,无需依赖单步预测的结果。这意味着它可以快速给出多步的预测值,无需进行多次迭代或叠加训练。
  • 直接多步预测不依赖单步预测的结果,因此可以避免由于单步预测误差累积而导致的长期预测精度下降的问题。

算法缺点:

  • 直接多步预测法需要为每个预测步长训练一个模型,这意味着如果预测步长很长,那么需要训练的模型数量会非常多,这增加了计算成本和模型管理的复杂性。

参考文档:时间序列多步预测的五种策略

(3)递归多步预测

定义:递归多步预测(Recursive Multi-Step Forecasting),用单个模型进行训练,通过使用模型已预测出的时间步的值作为输入,来预测下一个时间步的值,这个过程是递归进行的。

我们继续用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目标序列:[11,12,13]。

预测3个时间点的数值,我们只需构建1个模型,来递归预测3个未来数值。

当序列数据[8,9,10]预测出第11个数据值时,我们需要将这个预测值当做特征[9,10,11]去预测第12个数据。以此类推,递归迭代,直到预测过程全部完成。

模型的训练过程如下所示:

在这里插入图片描述

算法优点:

  • 递归多步预测只需要建立单步预测模型,不需要考虑复杂的多步预测关系式。这种方法使得预测的实现过程相对简单。
  • 递归多步预测通过利用时间序列数据之间的相关性,使用前一个时间步的预测结果来对下一个时间步进行预测,这有助于捕捉时间序列数据中的动态变化。

算法缺点:

  • 递归多步预测的主要缺点是误差累积。由于它是基于之前步骤的预测结果来进行下一步的预测,因此任何一步的预测误差都会被带入到后续的预测中,导致误差的累积。随着预测步数的增加,误差累积效应会变得更加严重,从而影响预测结果的准确性。

(4)直接+递归的混合预测

定义:直接+递归的混合预测(Direct-Recursive Hybrid Forecasting),结合直接策略和递归策略,构建n个模型预测未来n个值,但是每个模型都可以使用上一个模型预测出的结果继续预测。n个模型可以是同构的(相同的lag),也可以是异构的(不同的lag)。

我们继续用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目标序列:[11,12,13]。

我们构建了3个模型(异构模型)。

model1(用1阶滞后特征训练),预测出的第11个点数值,作为model2(用2阶滞后特征训练)的训练数据,预测出的第12个点数值,作为model3(用3阶滞后特征训练)的训练数据,继续预测第13个点的数值。

在这里插入图片描述

算法优点:

  • 直接多步预测方法虽然避免了递归方法中因使用预测值作为输入而导致的误差累积问题,但递归方法能够利用时间序列的相关性。混合预测方法通过结合两者的特性,可以在一定程度上减少误差累积,特别是在需要预测多个时间步长时。
  • 递归方法通过利用前一个时间步的预测结果来预测下一个时间步,从而能够充分利用时间序列的相关性。混合预测方法保留了这一特性,使得预测结果更加准确。

算法缺点:

  • 混合预测方法需要同时训练直接预测模型和递归预测模型,这增加了模型的复杂度。在实际应用中,可能需要更多的计算资源和时间来训练和优化模型。

(5)多输入多输出预测

定义:多输入多输出预测MIMO(Multiple Input Multiple Output),在一个模型里输出多个预测值,其本质是一种多输出模型。

我们继续用之前的示例模型:已知序列:[1,2,3,4,5,6,7,8,9,10],目标序列:[11,12,13]。

我们构建了1个模型,3个输入特征,3个输出预测值。

在这里插入图片描述

算法优点:

  • 由于模型能够同时预测多个未来的数值,因此可以显著提高预测的效率。这对于需要快速响应或处理大量数据的场景非常有用。
  • 在多步预测中,传统的递归预测方法可能会因为每一步的预测误差累积而导致预测结果逐渐偏离真实值。而多输出序列预测算法可以一次性预测多个时间点的值,从而减少了误差累积的可能性。

算法缺点:

  • 与单步预测相比,多输出序列预测算法需要同时处理多个时间点的预测任务,因此计算复杂度通常较高。这可能导致预测速度变慢,尤其是在处理大规模数据集时。
  • 为了训练一个准确的多输出序列预测模型,通常需要大量的历史数据来捕捉时间序列的复杂性和动态性。如果数据量不足或质量不高,可能会导致预测结果不准确。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/81729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【LLM】deepseek R1之GRPO训练笔记(持续更新)

note 相关框架对比: 需微调模型且资源有限 → Unsloth;本地隐私优先的小规模推理 → Ollama;复杂逻辑或多模态任务 → SGLang;高并发生产环境 → vLLM 微调SFT和GRPO是确实能学到新知识的四种格式(messages、sharegpt…

【数据结构】--- 单链表的增删查改

前言: 经过了几个月的漫长岁月,回头时年迈的小编发现,数据结构的内容还没有写博客,于是小编赶紧停下手头的活动,补上博客以洗清身上的罪孽 目录 前言 概念: 单链表的结构 我们设定一个哨兵位头节点给链…

【JAVA】数据类型与变量:深入理解栈内存分配(4)

核心知识点详细解释 Java 的基本数据类型和引用数据类型 基本数据类型 Java 有 8 种基本数据类型,它们可以分为 4 类: 整数类型:byte(1 字节)、short(2 字节)、int(4 字节&#…

ReentrantLock实现公平锁和非公平锁

在 Java 里,公平锁和非公平锁是多线程编程中用于同步的两种锁机制,它们的主要差异在于获取锁的顺序规则。下面是对二者的详细介绍: 公平锁 公平锁遵循 “先来先服务” 原则,也就是线程获取锁的顺序和请求锁的顺序一致。先请求锁…

一篇撸清 Http,SSE 与 WebSocket

HTTP,SSE 和WebSocket都是网络传输的协议,本篇快速介绍三者的概念和比较。 SSE(Server-Sent Events) 是什么? SSE(Server-Sent Events),服务器发送事件, 是一种基于 HTTP 的轻量级协议,允许服务器主动向客户端(如浏览器)推送实时数据。它设计用于单向通信(服务器到…

5个重要的财务指标讲解

1)净资产收益率 2)销售净利率 3) 销售毛利率 4)销售成本率 5) 期间费用率 好的,我将通过一个假设的案例(某公司2023年数据)逐步解释这些财务指标,并用具体数字演示计算…

PISI:眼图1:眼图相关基本概念

0 英文缩写 TIE(Time Interval Error)时间间隔误差,UI(Unit Interval)单位间隔PDF(Probability Density Function)概率密度函数BER(Bit Error Rate)误码率TJ&#xff08…

前端八股 CSS 2 选择器

选择器功能:选中特定 DOM节点进行渲染 原始方法 getElementById() getElementByName() 现在方法选择器 分类: id选择器 类选择器 标签选择器 逻辑与选择器 其他类型选择器: 伪类选择器: :link:未被访问的链接…

算法竞赛进阶指南.闇の連鎖

目录 题目算法标签: 树上差分, L C A LCA LCA, 倍增思路代码 题目 352. 闇の連鎖 算法标签: 树上差分, L C A LCA LCA, 倍增 思路 对于一个无向图, 第一次切断树边, 第二次切非树边, 一共多少种方案使得图不连通, 点数和边数都很大, 时间复杂度不能是 O ( n 2 ) O(n ^ 2…

ActiveMQ 与其他 MQ 的对比分析:Kafka/RocketMQ 的选型参考(二)

ActiveMQ、Kafka 和 RocketMQ 详细对比 性能对比 在性能方面,Kafka 和 RocketMQ 通常在高吞吐量场景下表现出色,而 ActiveMQ 则相对较弱。根据相关测试数据表明,Kafka 在处理大规模日志数据时,单机吞吐量可以达到每秒数十万条甚…

Electron 从零开始:构建你的第一个桌面应用

🖥️ Electron 从零开始:构建你的第一个桌面应用 Electron 是一个可以使用 HTML、CSS 和 JavaScript 构建跨平台桌面应用的框架。它将 Chromium 和 Node.js 融合到一个环境中,使 Web 开发者也能轻松开发原生桌面应用。 🚀 什么是 …

相向双指针-16. 最接近的三数之和

16. 最接近的三数之和 题目描述思路讲解代码展示复杂度分析相关标签 题目描述 思路讲解 思路和 15. 三数之和 类似,排序后,枚举 nums[i] 作为第一个数,那么问题变成找到另外两个数,使得这三个数的和与 target 最接近,…

C 语 言 - - - 文 件 操 作

C 语 言 - - - 文 件 操 作 文 件文 件 名文 件 操 作fopenfclose 文 件 的 顺 序 读 写fputcfgetcfputsfgetsfprintffscanffwritefread 流文 件 的 随 机 读 写fseekftellrewind 总结 💻作 者 简 介:曾 与 你 一 样 迷 茫,现 以 经 验 助 你…

Walrus 与 Pudgy Penguins 达成合作,为 Web3 头部 IP 引入去中心化存储

以将深受喜爱的数字藏品赋予生命而闻名的 IP 与品牌开发公司 Pudgy Penguins,现已集成 Walrus,用于存储和管理其日益增长的数字媒体资源库,包括在其产品和社区体验中使用的贴纸和 GIF。团队将率先通过 Tusky(Walrus 的用户友好型文…

2019ICPC陕西省赛暨陕西邀请赛题解 BCDEF HIJKL

共111支队伍,获奖情况(大概) 铜牌66 —— 3 296 银牌33 —— 4 391 金牌 11 —— 6 808 题目难度(过题)L F E B C I J D K H Problem - L - Codeforces 思路:注意到答案是连乘,只要有0…

5块钱的无忧套餐卡可以变成流量卡吗

电信的 5 块钱无忧套餐卡理论上可以变成流量卡,但会受到一些条件限制,以下是具体介绍: 中国电信无忧卡简介 中国电信无忧卡是电信推出的低月租套餐,月租仅 5 元,包含 200M 国内流量、来电显示和 189 邮箱,全…

SpringBoot校园失物招领平台源码开发实现

概述 实用的​​SpringBoot校园失物招领平台​​完整项目源码,帮助开发者快速构建校园失物招领系统。该项目采用SpringBootVue前后端分离架构,包含完整的注册登录、信息发布、认领管理等模块,是学习企业级项目开发的优秀范例 主要内容 1. …

如何在纯C中实现类、继承和多态(小白友好版)

基本实现原理 /* 通过结构体函数指针模拟类 */ typedef struct {// 成员变量int x; // 成员方法(函数指针) void (*print)(void* self); } MyClass;/* 成员函数实现 */ void my_print(void* self) {MyClass* obj (MyClass*)self;p…

51单片机入门教程——每个音符对应的重装载值

前言 本教程基于B站江协科技课程进行个人学习整理,专为拥有C语言基础的零基础入门51单片机新手设计。既帮助解决因时间差导致的设备迭代调试难题,也助力新手快速掌握51单片机核心知识,实现从C语言理论到单片机实践应用的高效过渡 。

股票单因子的检验方法有哪些?

股票单因子的检验方法主要包括以下四类方法及相关指标: 一、统计指标检验 IC值分析法 定义:IC值(信息系数)衡量因子值与股票未来收益的相关性,包括两种计算方式: Normal IC:基于Pearson相关系数…