兰考县住房和城乡建设局网站外国购物网站设计风格

web/2025/10/8 21:59:31/文章来源:
兰考县住房和城乡建设局网站,外国购物网站设计风格,免费咨询医生的软件有什么,网站后台无法上传本地图片文章目录 1 自回归模型AR Model1.1 自回归模型 vs 多元线性回归模型1.1.1 线性回归1.1.2 AR(1)模型1.1.3 AR(p)模型 1.2 AR建模问题 2 移动平均模型 MA Model2.1 MA模型的数学表示2.1.1 MA(1)模型2.2.2 MA(q)模型 2.2 MA建模问题 ARIMA模型是AR模型#xff08;自回归模型… 文章目录 1 自回归模型AR Model1.1 自回归模型 vs 多元线性回归模型1.1.1 线性回归1.1.2 AR(1)模型1.1.3 AR(p)模型 1.2 AR建模问题 2 移动平均模型 MA Model2.1 MA模型的数学表示2.1.1 MA(1)模型2.2.2 MA(q)模型 2.2 MA建模问题 ARIMA模型是AR模型自回归模型与MA模型移动平均模型结合后诞生的模型因此在理解ARIMA之前必须先理解AR与MA模型。由于ARIMA模型大多数时候只能处理单变量时间序列因此AR与MA模型也只能够被用于单变量时间序列。 1 自回归模型AR Model AR自回归模型是最早、最淳朴的时间序列模型之一它适用于“时间-标签”一一对应的单变量时序数据。AR模型的基本思想可以被概括为一句谚语罗马城不是一日建成的今天的结果一定依赖于过去的积累因此AR模型相信一个时间点上的标签值一定是依赖于之前的时间点上的标签值而存在的。这一基本思想包含了两个假设 不同时间点的标签值之间强相关(highly-correlated)位于时间点t的标签值一定强烈地受到t之前的标签值的影响。在数学上这意味着两个时间点的标签值之间的相关系数会较大。根据时间的基本属性两个时间点之间相隔越远相互之间的影响越弱例如昨天是否下雨对今天是否下雨的影响很大但三个月前的某天是否下雨对明天是否下雨的影响就相对较小 在这两个前提假设下AR模型将时间点之间的关系解构为一个时间点上的标签值可以由过去某个时间段内的所有时间点上的标签值线性组合后构成实际就是加权求和。用数学公式表示则有 y t c β 1 y t − 1 β 2 y t − 2 β 3 y t − 3 … β p y t − p z t ( 公式条件 β p ≠ 0 ) y_{t}c\beta_1y_{t-1}\beta_2y_{t-2}\beta_3y_{t-3}…\beta_py_{t-p}z_{t} \quad (公式条件\beta_p≠0) yt​cβ1​yt−1​β2​yt−2​β3​yt−3​…βp​yt−p​zt​(公式条件βp​0) 其中 y t y_{t} yt​表示在时间点时的标签训练时这里使用真实标签预测时这里输出预测标签 y t − 1 y_{t-1} yt−1​则表示在时间点的前一个时间点−1时的标签值。我们可以根据不同的场景规定与−1之间具体的时间间隔大小但在同一个时间序列中与−1之间的间隔一定是等同于−与−(−1)之间的间隔的。在该公式中不同的系数乘在每一个时间点的数值之前表示不同历史时间点的真实标签值以不同的方式影响着当前/未来时间点的真实标签值。很明显该公式与多元线性回归的方程非常类似只不过系数的脚标逐渐上升由1到p的同时标签的脚标在逐渐下降由t-1到t-p是从未来到过去。 需要注意的是该公式中包含两个常数项和 z t z_{t} zt​。其中是线性方程中惯例存在的常数项可以为0而 z t z_{t} zt​则代表当前时间点下无法被捕捉到的某些影响也就是白噪音White Noise。在统计学/数据挖掘领域中白噪音相当于是随机变量独立于任何已经获取的样本或标签数据因此在时间序列中白噪音代表着当下时间点可能发生的一切影响标签数值的偶然事件。虽然白噪声序列在不同的统计场景下往往定义有些区别在时间序列预测中最严格的情况下只有均值为0、方差为特定2、服从正态分布的序列才能被称之为白噪声序列在现实中我们往往无法使用这么严格的条件。由于和 z t z_{t} zt​都是常数因此我们往往将它们合并为一个对象 β 0 \beta_{0} β0​进行建模因此你也有可能看到公式 y t β 0 β 1 y t − 1 β 2 y t − 2 β 3 y t − 3 … β p y t − p y_{t}\beta_{0}\beta_1y_{t-1}\beta_2y_{t-2}\beta_3y_{t-3}…\beta_py_{t-p} yt​β0​β1​yt−1​β2​yt−2​β3​yt−3​…βp​yt−p​ 这一公式被称之为是p阶的自回归模型写作AR§且≠0。 1.1 自回归模型 vs 多元线性回归模型 1.1.1 线性回归 y w 0 w 1 x 1 w 2 x 2 … w p x p yw_{0}w_1x_{1}w_2x_{2}…w_px_{p} yw0​w1​x1​w2​x2​…wp​xp​ 很明显自回归模型的公式与多元线性回归相同因此我们对自回归模型的建模几乎等同于对多元线性回归的建模。但稍有区别的是多元线性回归中每个自变量都是一列数据要求解的标签也是一列数据但在自回归模型中每个自变量都是一个样本的数值要求解的标签y也是一个样本的数值。即是说一个自回归模型只能得出一个样本的结果。因此使用AR完成一个时间序列预测是需要建立多个AR模型的。因此在自回归模型中需要不断地建模来求解“下一个”时间点上的数值以构成序列数据—— 1.1.2 AR(1)模型 AR(1)模型在时间区间[0,t]上进行训练在时间区间[t1,tm]上进行预测为现在的时间点则有 训练求解 y 1 β 0 β 1 y 0 y 2 β 0 β 1 y 1 y 3 β 0 β 1 y 2 … y t β 0 β 1 y t − 1 y_{1}\beta_{0}\beta_{1}y_{0}\\ y_{2}\beta_{0}\beta_{1}y_{1}\\ y_{3}\beta_{0}\beta_{1}y_{2}\\ …\\ y_{t}\beta_{0}\beta_{1}y_{t-1}\\ y1​β0​β1​y0​y2​β0​β1​y1​y3​β0​β1​y2​…yt​β0​β1​yt−1​ 测试求解 [ y ( t 1 ) , y ( t 2 ) , … , y ( t m ) ] [y_{(t1)},y_{(t2)},…,y_{(tm)}] [y(t1)​,y(t2)​,…,y(tm)​]: y ^ ( t 1 ) β 0 β 1 y 0 y ^ ( t 2 ) β 0 β 1 y ^ ( t 1 ) y ^ ( t 3 ) β 0 β 1 y ^ ( t 2 ) … y ^ ( t m ) β 0 y ^ ( t m − 1 ) \hat{y}_{(t1)}\beta_{0}\beta_{1}y_{0}\\ \hat{y}_{(t2)}\beta_{0}\beta_{1}\hat{y}_{(t1)}\\ \hat{y}_{(t3)}\beta_{0}\beta_{1}\hat{y}_{(t2)}\\ …\\ \hat{y}_{(tm)}\beta_{0}\hat{y}_{(tm-1)} y^​(t1)​β0​β1​y0​y^​(t2)​β0​β1​y^​(t1)​y^​(t3)​β0​β1​y^​(t2)​…y^​(tm)​β0​y^​(tm−1)​ 1.1.3 AR§模型 AR§模型在时间区间[0,t]上进行训练在时间区间[t1,tm]上进行预测为现在的时间点则有 训练求解 y 1 β 0 β 1 y 0 β 2 y − 1 … β p y ( 1 − p ) y 2 β 0 β 1 y 1 β 2 y 0 … β p y ( 2 − p ) y 3 β 0 β 1 y 2 β 2 y 1 … β p y ( 3 − p ) … y t β 0 β 1 y t − 1 β 2 y t − 2 … β p y ( t − p ) y_{1}\beta_{0}\beta_{1}y_{0}\beta_{2}y_{-1}…\beta_{p}y_{(1-p)}\\ y_{2}\beta_{0}\beta_{1}y_{1}\beta_{2}y_{0}…\beta_{p}y_{(2-p)}\\ y_{3}\beta_{0}\beta_{1}y_{2}\beta_{2}y_{1}…\beta_{p}y_{(3-p)}\\ …\\ y_{t}\beta_{0}\beta_{1}y_{t-1}\beta_{2}y_{t-2}…\beta_{p}y_{(t-p)}\\ y1​β0​β1​y0​β2​y−1​…βp​y(1−p)​y2​β0​β1​y1​β2​y0​…βp​y(2−p)​y3​β0​β1​y2​β2​y1​…βp​y(3−p)​…yt​β0​β1​yt−1​β2​yt−2​…βp​y(t−p)​ 测试求解 [ y ( t 1 ) , y ( t 2 ) , … , y ( t m ) ] [y_{(t1)},y_{(t2)},…,y_{(tm)}] [y(t1)​,y(t2)​,…,y(tm)​]: y ^ ( t 1 ) β 0 β 1 y t β 2 y t − 1 … β p y ( t 1 − p ) y ^ ( t 2 ) β 0 β 1 y ^ ( t 1 ) β 2 y t … β p y ( t 2 − p ) y ^ ( t 3 ) β 0 β 1 y ^ ( t 2 ) β 2 y ^ ( t 1 ) … β p y ( t 3 − p ) … y ^ ( t m ) β 0 β 1 y ^ ( t m − 1 ) β 2 y ^ ( t m − 2 ) … β ( t m − p ) \hat{y}_{(t1)}\beta_{0}\beta_{1}y_{t}\beta_{2}y_{t-1}…\beta_{p}y_{(t1-p)}\\ \hat{y}_{(t2)}\beta_{0}\beta_{1}\hat{y}_{(t1)}\beta_{2}y_{t}…\beta_{p}y_{(t2-p)}\\ \hat{y}_{(t3)}\beta_{0}\beta_{1}\hat{y}_{(t2)}\beta_{2}\hat{y}_{(t1)}…\beta_{p}y_{(t3-p)}\\ …\\ \hat{y}_{(tm)}\beta_{0}\beta_{1}\hat{y}_{(tm-1)}\beta_{2}\hat{y}_{(tm-2)}…\beta_{(tm-p)} y^​(t1)​β0​β1​yt​β2​yt−1​…βp​y(t1−p)​y^​(t2)​β0​β1​y^​(t1)​β2​yt​…βp​y(t2−p)​y^​(t3)​β0​β1​y^​(t2)​β2​y^​(t1)​…βp​y(t3−p)​…y^​(tm)​β0​β1​y^​(tm−1)​β2​y^​(tm−2)​…β(tm−p)​ 当然现在大部分时间序列库会自动帮我们完成这个流程并不需要人为地多次建模来完成序列预测。观察上面的流程不难发现自回归模型比多元线性回归多出了一个超参数。 1.2 AR建模问题 在自回归模型的建模过程中需要回答三个问题 为了要预测未来的一个时间点上的数据需要收集过去多少时间点上的数据即是多少 当确定是多少后我们需要对应收集 y ( t − p ) y_{(t-p)} y(t−p)​的数据。例如如果模型是AR(1)那我们只需要保证要预测的第一个日期前面有一天的历史记录即可。如果模型是AR§则需要保证要预测的第一个日期前面至少有p天的历史记录。在实际建模过程中是一个超参数需要人为进行选择和定义。 为什么在测试时等号右边的有时是真实值有时是预测值 y ^ \hat{y} y^​ 在AR模型中假设5那任意日期的预测标签都等于当前日期前5天的标签加权求和后的结果。假设当前日期为1由于在建模之前我们可以保证收集到至少日期1之前5天已知的结果因此在求解 y ^ 1 \hat{y}_{1} y^​1​时等号右侧的所有标签都是收集到的、已知的真实历史数据即真实标签。 但当我们需要求解 y ^ 10 \hat{y}_{10} y^​10​时很明显10这个日期前5天中都只有预测标签、没有真实标签因此我们只能够使用预测出的 y ^ 5 \hat{y}_{5} y^​5​ y ^ 6 \hat{y}_{6} y^​6​ y ^ 7 \hat{y}_{7} y^​7​ y ^ 8 \hat{y}_{8} y^​8​ y ^ 9 \hat{y}_{9} y^​9​等5天的预测标签进行求解。因此在AR模型中等号右侧一般会混合使用真实标签和预测标签当预测标签占比更大时预测也会更加不准确故而在AR模型中预测离现在的日期越远的未来错误的可能性越大。 每个时间点的值以什么方式影响着 y t y_{t} yt​也就是{ β 0 , β 1 , β 2 , … , β p {\beta_{0},\beta_{1},\beta_{2},…,\beta_{p}} β0​,β1​,β2​,…,βp​}分别是多少 在AR模型中我们使用复杂的参数估计方法求解需要强调的是在对 y 1 , y 2 , … , y t y_{1},y_{2},…,y_{t} y1​,y2​,…,yt​的计算过程中所有 β 0 , β 1 , β 2 , … , β p {\beta_{0},\beta_{1},\beta_{2},…,\beta_{p}} β0​,β1​,β2​,…,βp​的值是一致的因为衡量的是“1天前2天前……p天前”的数值对今天的标签的影响而不关心t具体是什么时间。 2 移动平均模型 MA Model MA模型是不同于AR模型的、另一流派的时序模型。虽然与AR模型共同发源于经典统计学但MA模型的基本思想和基本假设却与AR模型大不相同。MA模型的基本思想是大部分时候时间序列应当是相对稳定的。在稳定的基础上每个时间点上的标签值受过去一段时间内、不可预料的各种偶然事件影响而波动。即在一段时间内时间序列应该是围绕着某个均值上下波动的序列时间点上的标签值会围绕着某个均值移动因此模型才被称为“移动平均模型 Moving Average Model”。 MA模型的思想中包含着统计学家们对时间维度更丰富的理解该模型假设 时间序列的(长期)趋势与时间序列的(短期)波动受不同因素的影响。从长期来看时间序列可能呈现缓慢上升、缓慢下降或周期性变动的趋势这种长时间展现出来的周期受历史标签、及标签本身属性的影响。但在一段较短时间内时间序列一定是相对稳定的令时间序列在短期内波动的因子不是历史标签、而是不可预料的各种偶然事件。不同时间点的标签值之间是关联的但各种偶然事件在不同时间点上产生的影响之间却是相互独立的。这一点与上面的假设是相辅相成的历史标签影响着时间序列的长期趋势那历史标签之间自然是相互关联的。相对的不可预料的偶然事件之间却没有关联。 MA模型中引入的“偶然事件”这部分思想指出了一个非常关键的点即时间只是我们用于记录数据的一种工具、一串锚点并不能完全影响一段时间内的标签值这与现代机器学习领域的理论非常相似。毕竟正如我们之前提过的影响明日会不会下雨的真正因素并不是“今天”或“昨天”这些时间概念本身而是风、云、日照等更加客观和科学的因素这些其实就是MA模型认为的“偶然因素”。不过我们也能够理解随着季节的变化、时间自有自己的周期因此天气也会存在季节性的周期因此从长期来看时间序列的趋势是恒定的。MA模型的观点着重于某个时间点的值是被难以想象的复杂因素所主导的而非只受到历史记录影响这一理。 2.1 MA模型的数学表示 基于MA模型的基本思想可以用如下公式表示MA模型 y t μ ϵ t θ 1 ϵ t − 1 θ 2 ϵ t − 2 θ 3 ϵ t − 3 … θ q ϵ t − q ( 公式条件 θ q ≠ 0 ) y_{t}\mu\epsilon_{t}\theta_{1}\epsilon_{t-1}\theta_{2}\epsilon_{t-2}\theta_{3}\epsilon_{t-3}…\theta_{q}\epsilon_{t-q}\quad (公式条件\theta_q≠0) yt​μϵt​θ1​ϵt−1​θ2​ϵt−2​θ3​ϵt−3​…θq​ϵt−q​(公式条件θq​0) 这一公式被称之为是q阶的移动平均模型写作MA(q)且≠0。不难发现这个公式虽然看上去也与线性回归非常相似但建模思路明显有巨大的差别—— 首先公式中的 y t y_{t} yt​​表示在时间点的标签值表示当前时间序列标签的均值 ϵ t \epsilon_{t} ϵt​​则表示在时间点时、不可预料、不可估计的偶然事件的影响 ϵ t − 1 \epsilon_{t-1} ϵt−1​​则代表在时间点−1时不可预料的、不可估计的偶然事件的影响。不难发现“偶然事件”这一定义与AR模型中白噪音的定义几乎一模一样它们都是当前时间点下无法被捕捉到的某些影响因此在MA模型中就代表当日的“白噪音”而AR模型公式中的 z t z_{t} zt​​也可使用 ϵ t \epsilon_{t} ϵt​​来表示。在理想条件下MA模型规定应当服从均值为0、标准差为1的正态分布但在实际计算时MA模型规定等同于模型的预测值 y ^ t \hat{y}_{t} y^​t​​与真实标签 y t y_{t} yt​​之间的差值Residuals即 ϵ t y t − y ^ t \epsilon_{t}y_{t}-\hat{y}_{t} ϵt​yt​−y^​t​ 由于偶然事件是无法被预料的、偶然事件带来的影响也是无法被预估的因此MA模型使用预测标签与真实标签之间的差异就来代表“无法被预料、无法被估计、无法被模型捕捉的偶然事件的影响”。MA模型相信这些影响累加起来共同影响下一个时间点的标签值因此 y t y_{t} yt​等于所有的线性组合加权求和。 在公式中不同的系数乘在每一个时间点的差值之前表示不同时间点发生的各种偶然事件对真实标签值所产生的影响不同需要注意的是今天的“偶然事件” ϵ t \epsilon_{t} ϵt​之前没有需要求解的系数即默认系数为1这可能代表今天的“偶然事件”对今天的标签的影响程度是100%。 在这一公式当中和 ϵ t \epsilon_{t} ϵt​都是常数项因此在一些教材当中我们也会看到将这两项进行合并后、整理为 θ 0 \theta_{0} θ0​来进行求解的情况但这种写法其实是不严谨的。有以下两个理由 1MA模型与AR模型不同 ϵ t \epsilon_{t} ϵt​虽然在结果上呈现为一个常数而不是一个需要求解的参数但它实际上是由标签 y t y_{t} yt​和预测值 y ^ t \hat{y}_{t} y^​t​的差值计算出来的、并不是在模型估计过程中和常数一样被估计出来的这一点令我们不能将 ϵ t \epsilon_{t} ϵt​当做普通的常数来看待。 2常数与常数对应了MA模型假设中的两个部分。MA模型假设时间序列的(长期)趋势与时间序列的(短期)波动受不同因素的影响而在该公式中常数对应的是长期趋势对应的是短期波动因代表的含义不同因此不能一概而论。 2.1.1 MA(1)模型 MA(1)模型在时间区间[0,t]上进行训练在时间区间[t1,tm]上进行预测为现在的时间点则有 训练求解 y 1 μ ϵ 1 θ 1 ϵ 0 y 2 μ ϵ 2 θ 1 ϵ 1 y 3 μ ϵ 3 θ 1 ϵ 2 … y t μ ϵ t θ 1 ϵ ( t − 1 ) y_{1}\mu\epsilon_{1}\theta_{1}\epsilon_{0}\\ y_{2}\mu\epsilon_{2}\theta_{1}\epsilon_{1}\\ y_{3}\mu\epsilon_{3}\theta_{1}\epsilon_{2}\\ …\\ y_{t}\mu\epsilon_{t}\theta_{1}\epsilon_{(t-1)}\\ y1​μϵ1​θ1​ϵ0​y2​μϵ2​θ1​ϵ1​y3​μϵ3​θ1​ϵ2​…yt​μϵt​θ1​ϵ(t−1)​ 测试求解 [ y ( t 1 ) , y ( t 2 ) , … , y ( t m ) ] [y_{(t1)},y_{(t2)},…,y_{(tm)}] [y(t1)​,y(t2)​,…,y(tm)​]: y ^ ( t 1 ) μ θ 1 ϵ t y ^ ( t 2 ) μ θ 1 ϵ ( t 1 ) y ^ ( t 3 ) μ θ 1 ϵ ( t 2 ) … y ^ ( t m ) μ θ 1 ϵ ( t m − 1 ) \hat{y}_{(t1)}\mu\theta_{1}\epsilon_{t}\\ \hat{y}_{(t2)}\mu\theta_{1}\epsilon_{(t1)}\\ \hat{y}_{(t3)}\mu\theta_{1}\epsilon_{(t2)}\\ …\\ \hat{y}_{(tm)}\mu\theta_{1}\epsilon_{(tm-1)}\\ y^​(t1)​μθ1​ϵt​y^​(t2)​μθ1​ϵ(t1)​y^​(t3)​μθ1​ϵ(t2)​…y^​(tm)​μθ1​ϵ(tm−1)​ 观察上面的式子,一个很明显的点是在训练的时候 y t y_{t} yt​由、 ϵ t \epsilon_{t} ϵt​、 θ 1 ϵ t − 1 \theta_{1}\epsilon_{t-1} θ1​ϵt−1​三项组成但在测试的时候 y ^ ( t 1 ) \hat{y}_{(t1)} y^​(t1)​却只由和 θ 1 ϵ t \theta_{1}\epsilon_{t} θ1​ϵt​两项组成。很明显测试的时候并不存在与 y ^ ( t 1 ) \hat{y}_{(t1)} y^​(t1)​的角标相匹配的 ϵ t 1 \epsilon_{t1} ϵt1​在MA模型当中测试时的公式与训练时的公式有所不同。以 y 1 y_{1} y1​的公式为例 y 1 μ ϵ 1 θ 1 ϵ 0 y_{1}\mu\epsilon_{1}\theta_{1}\epsilon_{0} y1​μϵ1​θ1​ϵ0​ 而根据的定义有 ϵ 1 y 1 − y ^ 1 \epsilon_{1}y_{1}-\hat{y}_{1} ϵ1​y1​−y^​1​ 将 ϵ 1 \epsilon_{1} ϵ1​的计算方式带入 y 1 y_{1} y1​的式子后不难发现 y 1 μ ϵ 1 θ 1 ϵ 0 y 1 μ ( y 1 − y ^ 1 ) θ 1 ϵ 0 y ^ 1 μ θ 1 ϵ 0 y_{1}\mu\epsilon_{1}\theta_{1}\epsilon_{0}\\ y_{1}\mu(y_{1}-\hat{y}_{1})\theta_{1}\epsilon_{0}\\ \hat{y}_{1}\mu\theta_{1}\epsilon_{0} y1​μϵ1​θ1​ϵ0​y1​μ(y1​−y^​1​)θ1​ϵ0​y^​1​μθ1​ϵ0​ 因此在MA模型中预测值 y ^ \hat{y} y^​和真实值的计算公式是不相同的。这一点也符合对的定义身为当日的“白噪音”即模型无法捕捉到、无法预测的偶然影响我们只能记录历史的影响而无法知晓今天的影响。因此在使用历史数据进行训练时可以使用历史的但在对未来进行预测时我们却无法使用未知的“未来偶然影响”。这一点可以被推广到q阶MA模型中。 2.2.2 MA(q)模型 MA(q)模型在时间区间[0,t]上进行训练在时间区间[t1,tm]上进行预测为现在的时间点则有 训练求解 y 1 μ ϵ 1 θ 1 ϵ 0 θ 2 ϵ − 1 … θ q ϵ ( 1 − q ) y 2 μ ϵ 2 θ 1 ϵ 1 θ 2 ϵ 0 … θ q ϵ ( 2 − q ) y 3 μ ϵ 3 θ 1 ϵ 2 θ 2 ϵ 1 … θ q ϵ ( 3 − q ) … y t μ ϵ t θ 1 ϵ ( t − 1 ) θ 2 ϵ ( t − 2 ) … θ q ϵ ( t − q ) y_{1}\mu\epsilon_{1}\theta_{1}\epsilon_{0}\theta_{2}\epsilon_{-1}…\theta_{q}\epsilon_{(1-q)}\\ y_{2}\mu\epsilon_{2}\theta_{1}\epsilon_{1}\theta_{2}\epsilon_{0}…\theta_{q}\epsilon_{(2-q)}\\ y_{3}\mu\epsilon_{3}\theta_{1}\epsilon_{2}\theta_{2}\epsilon_{1}…\theta_{q}\epsilon_{(3-q)}\\ …\\ y_{t}\mu\epsilon_{t}\theta_{1}\epsilon_{(t-1)}\theta_{2}\epsilon_{(t-2)}…\theta_{q}\epsilon_{(t-q)}\\ y1​μϵ1​θ1​ϵ0​θ2​ϵ−1​…θq​ϵ(1−q)​y2​μϵ2​θ1​ϵ1​θ2​ϵ0​…θq​ϵ(2−q)​y3​μϵ3​θ1​ϵ2​θ2​ϵ1​…θq​ϵ(3−q)​…yt​μϵt​θ1​ϵ(t−1)​θ2​ϵ(t−2)​…θq​ϵ(t−q)​ 测试求解 [ y ( t 1 ) , y ( t 2 ) , … , y ( t m ) ] [y_{(t1)},y_{(t2)},…,y_{(tm)}] [y(t1)​,y(t2)​,…,y(tm)​]: y ^ ( t 1 ) μ θ 1 ϵ t θ 2 ϵ t − 1 … θ q ϵ ( t 1 − q ) y ^ ( t 2 ) μ θ 1 ϵ t 1 θ 2 ϵ t … θ q ϵ ( t 2 − q ) y ^ ( t 3 ) μ θ 1 ϵ t 2 θ 2 ϵ t 1 … θ q ϵ ( t 3 − q ) … y ^ ( t m ) μ θ 1 ϵ ( t m − 1 ) θ 2 ϵ ( t m − 2 ) … θ q ϵ ( t m − q ) \hat{y}_{(t1)}\mu\theta_{1}\epsilon_{t}\theta_{2}\epsilon_{t-1}…\theta_{q}\epsilon_{(t1-q)}\\ \hat{y}_{(t2)}\mu\theta_{1}\epsilon_{t1}\theta_{2}\epsilon_{t}…\theta_{q}\epsilon_{(t2-q)}\\ \hat{y}_{(t3)}\mu\theta_{1}\epsilon_{t2}\theta_{2}\epsilon_{t1}…\theta_{q}\epsilon_{(t3-q)}\\ …\\ \hat{y}_{(tm)}\mu\theta_{1}\epsilon_{(tm-1)}\theta_{2}\epsilon_{(tm-2)}…\theta_{q}\epsilon_{(tm-q)}\\ y^​(t1)​μθ1​ϵt​θ2​ϵt−1​…θq​ϵ(t1−q)​y^​(t2)​μθ1​ϵt1​θ2​ϵt​…θq​ϵ(t2−q)​y^​(t3)​μθ1​ϵt2​θ2​ϵt1​…θq​ϵ(t3−q)​…y^​(tm)​μθ1​ϵ(tm−1)​θ2​ϵ(tm−2)​…θq​ϵ(tm−q)​ 2.2 MA建模问题 在MA建模过程中我们需要回答以下问题 为了预测未来的一个时间点上的标签值我们需要收集过去多少时间点上的“偶然事件的影响”即是多少 与AR模型中的p一样MA模型中的q是我们需要定义的超参数一般都设置为[1,5]之内的正整数但偶尔也可能出现一些较大的数字。在统计学中可以使用自相关系数ACFAuto-correlation function、偏相关系数PACFPartial Auto-Correlation Function或者相关的假设检验来帮助我们确定p、q等超参数的值其中PACF用于确定AR模型的p值ACF用于确定MA模型的q值假设检验则可以同时用于两种模型。大部分时候p和q是可以被算法自主确定的且p和q手动确定的流程较为复杂。 每个时间点的偶然事件对标签值产生了多大的影响也就是{ ϵ 0 , ϵ 1 , ϵ 2 , … , ϵ q {\epsilon_{0},\epsilon_{1},\epsilon_{2},…,\epsilon_{q}} ϵ0​,ϵ1​,ϵ2​,…,ϵq​}分别是多少同时每个时间点的偶然事件以什么样的方式影响着 y t y_{t} yt​也就是{ μ , θ 1 , θ 2 , θ 3 , … , θ q {\mu,\theta_{1},\theta_{2},\theta_{3},…,\theta_{q}} μ,θ1​,θ2​,θ3​,…,θq​}分别是多少 对大多数模型来说这两个问题是应该分开提问的但MA模型却需要在训练过程中一次性求解出所有的和。的求解是MA模型求解过程中会遇见的第一个难点也是许多教材在具体描述时会避而不谈的地方。以MA(1)模型为假设在训练过程中我们有如下流程 y 1 μ ϵ 1 θ 1 ϵ 0 y 2 μ ϵ 2 θ 1 ϵ 1 y 3 μ ϵ 3 θ 1 ϵ 2 … y t μ ϵ t θ 1 ϵ ( t − 1 ) y_{1}\mu\epsilon_{1}\theta_{1}\epsilon_{0}\\ y_{2}\mu\epsilon_{2}\theta_{1}\epsilon_{1}\\ y_{3}\mu\epsilon_{3}\theta_{1}\epsilon_{2}\\ …\\ y_{t}\mu\epsilon_{t}\theta_{1}\epsilon_{(t-1)}\\ y1​μϵ1​θ1​ϵ0​y2​μϵ2​θ1​ϵ1​y3​μϵ3​θ1​ϵ2​…yt​μϵt​θ1​ϵ(t−1)​ 该公式看似简单但其实存在着巨大的问题因为在第一次训练时 y 1 y_{1} y1​作为标签是已知的但 y 1 y_{1} y1​这一公式的等号右侧所有的元素都是未知的更离奇的是这些未知元素中的 ϵ 1 y 1 − y ^ 1 , ϵ 0 y 0 − y ^ 0 \epsilon_{1}y_{1}-\hat{y}_{1},\epsilon_{0}y_{0}-\hat{y}_{0} ϵ1​y1​−y^​1​,ϵ0​y0​−y^​0​但因为我们并不知道 y ^ 1 \hat{y}_{1} y^​1​、 y ^ 0 \hat{y}_{0} y^​0​和 y 0 y_{0} y0​是多少同时由于时间点是从1开始因此根本没有时间点0处的真实标签因此使用一般数学过程两个 都无法被求解。此时应该怎么办呢 首先很明显现在一般数学过程无法完成对参数和的求解因此我们需要使用带迭代过程的参数估计办法如最小二乘、梯度下降等对这些参数进行求解。这类求解方法会先假设一组初始参数值一般为随机数并在迭代过程中逐渐修正这些参数。因此我们可以假设最初的和 θ 1 \theta_{1} θ1​是任意随机数。 假设一个初始化用的 ϵ 0 \epsilon_{0} ϵ0​的值通常是计算当前标签的均值、或设置为0.05之类的初始值。当然也可以使用参数估计方式对 ϵ 0 \epsilon_{0} ϵ0​进行估计但现实中大部分时候是设置一个固定的初始值毕竟根据MA模型的计算公式。 ϵ 0 \epsilon_{0} ϵ0​只影响最初的一段时间。 在假设完 ϵ 0 \epsilon_{0} ϵ0​、初始值和初始值 θ 1 \theta_{1} θ1​的情况下根据公式 y 1 μ ϵ 1 θ 1 ϵ 0 y_{1}\mu\epsilon_{1}\theta_{1}\epsilon_{0} y1​μϵ1​θ1​ϵ0​求解唯一未知的数 ϵ 1 \epsilon_{1} ϵ1​这样 ϵ 1 \epsilon_{1} ϵ1​就可以被用在 y 2 y_{2} y2​的公式中用于求解 ϵ 2 \epsilon_{2} ϵ2​了。同理 ϵ 2 \epsilon_{2} ϵ2​求解完毕后就可以被用于求解 ϵ 3 \epsilon_{3} ϵ3​这样就可以在训练中求解出所有的。 在第一次求解出所有的后需要根据当前值的情况按公式求解出 [ y ^ 1 , y ^ 2 , y ^ 3 , … … , y ^ t ] [\hat{y}_{1},\hat{y}_{2},\hat{y}_{3},……,\hat{y}_{t}] [y^​1​,y^​2​,y^​3​,……,y^​t​]计算该序列与真实标签 [ y 1 , y 2 , y 3 , … , y t ] [y_{1},y_{2},y_{3},…,y_{t}] [y1​,y2​,y3​,…,yt​]的差异依赖该差异按最小二乘或梯度下降中的方法更新迭代和。 silon_{2} 求解完毕后就可以被用于求解 求解完毕后就可以被用于求解 求解完毕后就可以被用于求解\epsilon_{3}$这样就可以在训练中求解出所有的。 在第一次求解出所有的后需要根据当前值的情况按公式求解出 [ y ^ 1 , y ^ 2 , y ^ 3 , … … , y ^ t ] [\hat{y}_{1},\hat{y}_{2},\hat{y}_{3},……,\hat{y}_{t}] [y^​1​,y^​2​,y^​3​,……,y^​t​]计算该序列与真实标签 [ y 1 , y 2 , y 3 , … , y t ] [y_{1},y_{2},y_{3},…,y_{t}] [y1​,y2​,y3​,…,yt​]的差异依赖该差异按最小二乘或梯度下降中的方法更新迭代和。 迭代完毕后再按照新的和重新计算重复上述过程直至 [ y ^ 1 , y ^ 2 , y ^ 3 , … … , y ^ t ] [\hat{y}_{1},\hat{y}_{2},\hat{y}_{3},……,\hat{y}_{t}] [y^​1​,y^​2​,y^​3​,……,y^​t​]计算该序列与真实标签 [ y 1 , y 2 , y 3 , … , y t ] [y_{1},y_{2},y_{3},…,y_{t}] [y1​,y2​,y3​,…,yt​]的差异变得足够小为止。当迭代完成时我们就能够求解出所有的以及所有的和。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/89284.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

求西北地区网站建设专家 西安沉睡网络 官方网址?网站建设行业细分

1.Three.js 实现模型材质局部辉光效果 2.解决辉光效果影响场景背景图显示的问题 相关API的使用: 1. EffectComposer(渲染后处理的通用框架,用于将多个渲染通道(pass)组合在一起创建特定的视觉效果) 2. …

简单的网站建设步骤网站图片居中代码

文字排版--粗体 我们还可以使用css样式来改变文字的样式:粗体、斜体、下划线、删除线,可以使用下面代码实现设置文字以粗体样式显示出来。 p span{font-weight:bold;} 在这里大家可以看到,如果想为文字设置粗体是有单独的css样式来实现的&…

企业网站建设大概的费用清远市发布

深度优先搜索DFS搜索 DFS:从根节点出发,寻找子节点,到最深层返回到上一层继续递归搜索。 B3621 枚举元组 题目传送 题面 题目描述 n 元组是指由 n 个元素组成的序列。例如 (1,1,2) 是一个三元组、(233,254,277,123)是一个四元组。 给定…

网站设计论文答辩问题及答案品划做网站

反转字符串中的元音字符Given a string and we have to eliminate/ remove all vowels from the string using C program. 给定一个字符串,我们必须使用C程序从字符串中消除/删除所有元音。 To eliminate/remove the vowels 消除/删除元音 We will traverse (reac…

设计类的网站和简介怎么开通自己的微信公众号

本文非原创 可分为:交叉连接、内连接、外连接、自连接 1.使用交叉连接: 它是非限制连接,就是将两个表格不加任何条件的组合在一起, 即第一个表格的所有记录分别和第二个表格的每一条记录相连接 组合成新的记录,连接后结…

网站免费在线观看app大全免费软件下载安装

文章目录 问题举例问题分析解决办法问题举例 我们在使用ArcGIS时经常会碰到这样的问题:将地图文档(.mxd)保存到本地并拷贝到别的电脑上或改变一个路径时,出现数据丢失的现象,具体表现为图层前面出现一个红色的感叹号,如下图所示。 出现以上问题的根本原因是数据GSS.tif的…

帝国程序如何改网站标题单位门户网站功能

注意:本节主要讲React中的虚拟DOM,但是虚拟DOM并不是React中特有的内容。 1. React 中虚拟 DOM是什么? 虚拟DOM是对真实DOM的描述,虚拟DOM是JS对象,实际上就是 JSX 通过 babel 转换成 React.createElement()&#xff…

网站建设 网页设计 网站制作织梦猫html5高端网络服务机构网站模板

数组的创建和使用 奇数位于偶数之前冒泡排序两数之和只出现一次的数字多数元素存在连续三个奇数的数组 奇数位于偶数之前 调整数组顺序使得奇数位于偶数之前。调整之后,不关心大小顺序。 如数组:[1,2,3,4,5,6] 调整后可能是:[1, 5, 3, 4, 2,…

西安网站开发定制制作后台网站开发文档

六大设计原则 1、单一职责原则 一个类或者模块只负责完成一个职责或者功能。 2、开放封闭原则 规定软件中的对象、类、模块和函数对扩展应该是开放的,对于修改应该是封闭的。用抽象定义结构,用具体实现扩展细节。 3、里氏替换原则 如果S是T的子类型…

帝国cms网站名称零基础网站建设教学公司

在现代前端开发中,搭建一个高效、灵活、易用的后台管理系统并不容易。然而,Vue3 的出现为我们提供了一个备受瞩目的选择。作为一个现代化的前端框架,Vue3 具有众多优点,能够帮助开发者快速搭建企业级中后台产品原型。 今天&#…

引航科技提供网站建设深圳市宝安区石岩街道

如果这篇博客对您有用的话,可以给我点个赞吗,这对我很重要,谢谢!❤️ 2.1.4 进程通信 知识总览 2.1.4.1 什么是进程通信 顾名思义,进程通信就是指进程之间的信息交换。 进程是分配系统资源的单位(包括内…

艺术网站源码设计制作一个保温杯教学反思

真正的有钱人对金钱持非常严肃的态度,即便是拿来投机也要小心睿智,物尽其用。这里的投机并不是指非理性的赌博,而是指为了追求更高收益而采取的市场投资行为。卡西研究所资深分析师Louis James总结了富豪们投机成功的9个秘诀。 秘诀1&#…

thinkphp开发的网站wordpress 提问模板

Linux系统操作命令 一、文件管理 ls:列出当前目录下的文件和文件夹。 ls -l:以详细列表的形式显示文件的权限、所有者和大小等信息。 cd:切换当前目录。 cd ..:返回上一级目录。cd /:返回根目录。 pwd:显示…

moodle网站建设工厂采购信息网

文件描述符 fd是一个>0 的整数 每打开一个文件,就创建一个文件描述符,通过文件描述符来操作文件 预定义的文件描述符: 0:标准输入,对应于已打开的标准输入设备(键盘) 1:标准输出,对应于已打开的标准输出设备(控制台) 2.标准错误…

网站首页建设网从seo角度谈网站建设

目录 文章目录 以从备份恢复forest_resources库为例一、备份数据库二、需要还原的数据库准备1 删除掉远程的库。2 重新创建一个空的库。可以使用sql3 找到数据库存放的路径,并将备份文件上传到对应的路径下 三、 进入docker容器内部,执行数据库恢复附录…

大连网站建设详细流程中国建设教育网官方网站

堆是将一组数据按照完全二叉树的存储顺序,将数据存储在一个一维数组中的结构。 大顶堆:任意节点的值均大于等于它的左右孩子,并且最大的值位于堆顶,即根节点处。 小顶堆:任意节点的值均小于等于它的左右孩子&#xff0…

网站强制使用极速模式做彩票生意要登陆哪个网站

给你一个整数数组 bloomDay,以及两个整数 m 和 k 。 现需要制作 m 束花。制作花束时,需要使用花园中 相邻的 k 朵花 。 花园中有 n 朵花,第 i 朵花会在 bloomDay[i] 时盛开,恰好 可以用于 一束 花中。 请你返回从花园中摘 m 束…

怎么用qq邮箱做网站无经验能做sem专员

主线程 任务1,任务2 微队列微队列任务1, 微队列任务2延时队列延时队列任务1, 延时队列任务2交互队列.... 事件循环的工作原理 主线程执行同步任务: 主线程首先执行所有同步任务(即栈中的任务)。这些任务会…

企业网站栏目设计品牌设计的基本步骤

1.SIGCHLD简介 SIGCHILD是指在一个进程终止或者停止时,将SIGCHILD信号发送给其父进程,按照系统默认将忽略此信号,如果父进程希望被告知其子系统的这种状态,则应捕捉此信号。注意:SIGCLD信号与其长得非常相似。SIGCLD是…

适合网站开发的框架怎么增加网站的关键词库

最近公司项目需要做各种图标展示,用了Echarts的条形图和柱状图,但是老板还是觉得不够生动,看来时候祭出大招了 由此衍生在空余时间写下了此篇博客,首先还是看效果图: 注意,此图中数据并非真实数据,只是为…