正态总体中标准化单样本残差的分布推导

news/2025/10/17 12:28:06/文章来源:https://www.cnblogs.com/BoyaYan/p/19147526

摘要

本文完整推导了从正态总体 \(N(\mu, \sigma^2)\) 中抽取的样本中,单个标准化残差 \(W = (X_1 - \bar{X}) / \sqrt{\sum(X_i - \bar{X})^2}\) 的概率密度函数。证明过程利用了赫尔默特变换与多元正态分布的旋转不变性,将 \(W^2\) 与Beta分布关联,最终通过变量代换求得其精确的函数形式与支撑集。

1. 题目表述

问题背景

\(X_1, X_2, \dots, X_n\) (其中样本量 \(n>2\)) 是来自正态分布总体 \(N(\mu, \sigma^2)\) 的一组简单随机样本。

定义样本均值 \(\bar{X}\)

\[\bar{X} = \frac{1}{n}\sum_{i=1}^{n} X_i \]

定义离差平方和 (Sum of Squared Deviations) \(S_{SS}^2\)

\[S_{SS}^2 = \sum_{i=1}^{n}(X_i - \bar{X})^2 \]

求解目标

求统计量 \(W\) 的概率密度函数 (PDF):

\[W = \frac{X_1 - \bar{X}}{\sqrt{\sum_{i=1}^{n}(X_i - \bar{X})^2}} \]

2. 完整推导过程

第一步:问题的简化 (详细展开)

此步骤旨在证明统计量 \(W\) 的分布与总体参数 \(\mu\)\(\sigma\) 无关。

  1. 定义标准化变量:
    我们定义一个标准化的随机变量 \(Y_i = \frac{X_i - \mu}{\sigma}\)。根据正态分布的性质,可知 \(Y_i \sim N(0, 1)\) 且相互独立。其反向关系为:\(X_i = \sigma Y_i + \mu\)

  2. \(Y_i\) 表示分子:
    首先,用 \(Y_i\) 表示样本均值 \(\bar{X}\)

    \[\bar{X} = \frac{1}{n}\sum_{i=1}^{n} (\sigma Y_i + \mu) = \sigma\bar{Y} + \mu \]

    现在,我们可以表示分子 \(X_1 - \bar{X}\)

    \[X_1 - \bar{X} = (\sigma Y_1 + \mu) - (\sigma\bar{Y} + \mu) = \sigma(Y_1 - \bar{Y}) \]

  3. \(Y_i\) 表示分母:
    对于任意一项 \(X_i - \bar{X}\),我们有 \(X_i - \bar{X} = \sigma(Y_i - \bar{Y})\)。因此,离差平方和为:

    \[\sum_{i=1}^{n}(X_i - \bar{X})^2 = \sum_{i=1}^{n} [\sigma(Y_i - \bar{Y})]^2 = \sigma^2 \sum_{i=1}^{n}(Y_i - \bar{Y})^2 \]

    分母即为上式的平方根:

    \[\sqrt{\sum_{i=1}^{n}(X_i - \bar{X})^2} = \sigma \sqrt{\sum_{i=1}^{n}(Y_i - \bar{Y})^2} \]

  4. 合并与结论:
    将用 \(Y_i\) 表示的分子和分母代回 \(W\) 的定义:

    \[W = \frac{\sigma(Y_1 - \bar{Y})}{\sigma \sqrt{\sum_{i=1}^{n}(Y_i - \bar{Y})^2}} = \frac{Y_1 - \bar{Y}}{\sqrt{\sum_{i=1}^{n}(Y_i - \bar{Y})^2}} \]

    最终表达式完全由 \(Y_i \sim N(0,1)\) 构成。因此,不失一般性,在后续推导中,我们直接假设样本 \(X_i\) 来自标准正态分布 \(N(0, 1)\)

第二步:赫尔默特(Helmert)正交变换

我们引入一个 \(n \times n\) 的正交矩阵 \(A\) (即 \(A^TA=I\)),对原始样本向量 \(X\) 进行线性变换,得到新向量 \(V=AX\)\(V\) 的分量 \(V_1, \dots, V_n\) 是相互独立的标准正态随机变量。我们构造 \(A\) 使其最后一行 \(A_{n,j} = 1/\sqrt{n}\),从而得到 \(V_n = \sqrt{n} \bar{X}\)

第三步:用新变量表示统计量的各部分

  1. 分母的推导:

    \[\sum_{i=1}^{n}(X_i - \bar{X})^2 = \sum X_i^2 - n\bar{X}^2 = \left(\sum V_i^2\right) - n\left(\frac{V_n}{\sqrt{n}}\right)^2 = \sum_{i=1}^{n-1} V_i^2 \]

  2. 分子的推导:

    \[X_1 - \bar{X} = \sum_{i=1}^{n} A_{i,1} V_i - \frac{V_n}{\sqrt{n}} = \sum_{i=1}^{n-1} A_{i,1} V_i \]

    令系数 \(c_i = A_{i,1}\)。可推导出:

    \[\sum_{i=1}^{n-1} c_i^2 = 1 - (1/\sqrt{n})^2 = \frac{n-1}{n} \]

第四步:利用旋转不变性的严格数学证明

  1. 定义与前提:

    • 随机向量: 令 \(V = (V_1, \dots, V_{n-1})^T\) 为随机向量,其服从 \((n-1)\) 维标准多元正态分布,记为 \(V \sim N_{n-1}(0, I_{n-1})\)
    • 常数向量: 令 \(c = (c_1, \dots, c_{n-1})^T \in \mathbb{R}^{n-1}\) 为常数向量,其范数平方为 \(\|c\|^2 = c^T c = \frac{n-1}{n}\)
    • 统计量函数: 统计量 \(W\) 是一个函数 \(W(V) = \frac{c^T V}{\|V\|}\)
  2. 关键引理:标准多元正态分布的旋转不变性:
    设随机向量 \(V \sim N_{n-1}(0, I_{n-1})\),并令 \(Q\) 为任意一个 \((n-1) \times (n-1)\) 的正交矩阵。则变换后的随机向量 \(U = QV\) 与原向量 \(V\) 同分布。

  3. 证明过程:
    根据引理,\(W(V)\) 的分布与 \(W(QV)\) 的分布相同。我们可以构造一个特定的正交矩阵 \(Q\),使得 \(Qc = \|c\| e_1\),其中 \(e_1 = (1, 0, \dots, 0)^T\) 是第一个标准基向量。
    \(W\) 在分布上等同于 \(W(Q^T U) = \frac{(Qc)^T U}{\|U\|} = \frac{\|c\| U_1}{\|U\|}\)
    代入 \(\|c\|\)\(\|U\|\) 的表达式,可得 \(W\) 在分布上等同于:

    \[\frac{\sqrt{\frac{n-1}{n}} U_1}{\sqrt{U_1^2 + \sum_{i=2}^{n-1} U_i^2}} \]

第五步:关联贝塔(Beta)分布并进行精确求解

  1. 确认关系和已知分布:
    \(T^2 = \sum_{i=2}^{n-1} U_i^2\),则 \(T^2 \sim \chi^2_{n-2}\)。同时 \(U_1^2 \sim \chi^2_1\),且两者独立。我们有:

    \[W^2 = \frac{n-1}{n} \left( \frac{U_1^2}{U_1^2 + T^2} \right) \]

    \(B = \frac{U_1^2}{U_1^2 + T^2}\),则 \(B \sim \text{Beta}(\frac{1}{2}, \frac{n-2}{2})\)

  2. 第一次变量变换:从 \(B\) 推导 \(Y=W^2\) 的分布:
    \(Y = W^2 = \frac{n-1}{n} B\)。通过变量变换可得:

    \[f_Y(y) = \frac{\sqrt{n}}{\sqrt{n-1}} \frac{y^{-1/2}(1-\frac{ny}{n-1})^{(n-4)/2}}{B(1/2, (n-2)/2)}, \quad y \in (0, \frac{n-1}{n}) \]

  3. 第二次变量变换:从 \(Y=W^2\) 推导 \(W\) 的分布:
    由于 \(W\) 分布的对称性,其PDF \(f_W(w)\)\(Y\) 的PDF \(f_Y(y)\) 存在关系 \(f_W(w) = |w| f_Y(w^2)\)。代入上式并化简可得最终结果。

3. 最终结论

经过上述完整推导,统计量 \(W = \frac{X_1 - \bar{X}}{\sqrt{\sum(X_i - \bar{X})^2}}\) 的概率密度函数为:

\[f(w) = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{1}{2}) \Gamma(\frac{n-2}{2})} \sqrt{\frac{n}{n-1}} \left(1 - \frac{nw^2}{n-1}\right)^{(n/2)-2} \]

该函数的定义域 (support) 为:

\[w \in \left(-\sqrt{\frac{n-1}{n}}, \sqrt{\frac{n-1}{n}}\right) \]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/938817.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年轧钢设备厂家权威推荐榜:冷轧机、热轧机源头生产厂家,技术实力与市场口碑深度解析

2025年轧钢设备厂家权威推荐榜:冷轧机、热轧机源头生产厂家,技术实力与市场口碑深度解析行业背景与发展现状钢铁工业作为国民经济的重要支柱产业,其生产装备的技术水平直接关系到产品质量和生产效率。冷轧机与热轧机…

实用指南:在鸿蒙NEXT中发起HTTP网络请求:从入门到精通

实用指南:在鸿蒙NEXT中发起HTTP网络请求:从入门到精通pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&…

10.16 CSP-S 模拟赛总结

ContestT1 我很神秘。数据水理论复杂度 \(O(nk^2)\) 暴力过了。 实际上只要想到对 \(k\) 取模就会做了。因为满足要求的情况即为存在一段 \([l,r]\) 的子区间和对 \(k\) 取模为 \(0\),那么等价于两次前缀和对 \(k\) 取…

远程无钥匙进入(PKE)技术:便利与安全的完美融合

PKE 远程无钥匙进入 在智能汽车时代,远程无钥匙进入(Passive Keyless Entry,简称PKE)已成为提升用户体验的核心技术。它允许车主无需手动操作钥匙,只需携带智能钥匙靠近车辆,即可自动解锁车门或启动引擎。根据20…

灵动岛iPhone状态栏获得高度不对 iOS iPhone14pro iPhone14pro max状态栏获得高度不对

之前的获得状态栏高度代码是(CGFloat)statusRectHeight { if (@available(iOS 13.0, *)) { _statusRectHeight = [UIApplication sharedApplication].windows.firstObject.windowScene.statusBarManager.statusBarFram…

string略解

string 字符串类型,下标从0开始。 函数用法 定义 #include <iostream> #include <string>string s;初始化 string s="Hello,World!";sting a="Hello,"; string b="World!"…

《程序员修炼之道》 阅读笔记二

核心概念解读 “软件的熵”也被称为“破窗效应”。一个软件项目,如果出现了第一个糟糕的设计、第一个临时的脏代码、第一个没有修复的bug,而没有人去处理,它就会迅速腐烂。这就像一栋建筑有一扇破窗不被修理,很快就…

是时候告别向日葵、Todesk、TeamViewer了,快速搭建自托管服务器RustDesk

是时候告别向日葵、Todesk、TeamViewer了,快速搭建自托管服务器RustDesk最早我一直在用向日葵,但后来被限速,体验越来越差。远程操作,没必要花钱,于是开始找免费的替代方案。 后来试了ToDesk,刚开始感觉还行,但…

史馆

发言人 内容至“某些人”的一封信 https://www.luogu.com.cn/article/qdk2rgrt行啊,我没开完隐,你谴责我注册时间早,你来看看我注册之后都在干什么你拒绝是你的事,学校怎样做是学校的事,如果你来问我文化课我会拒…

firecrawl 私有部署(test)

firecrawl 私有部署(test) github: https://github.com/firecrawl/firecrawl 文档: https://docs.firecrawl.dev/introduction安装:git clone https://github.com/firecrawl/firecrawl.gitcd firecrawldocker co…

$\text{Catalan}$ 数 卡特兰数

定义公式 \(1\):\(C_n=\begin{pmatrix}2n\\n\end{pmatrix}-\begin{pmatrix}2n\\n-1\end{pmatrix}\)公式 \(2\):\(C_n=\sum_{a+b=n-1}C_aC_b\)公式 \(3\):\(C_n=\frac{4n-2}{n+1}C_{n-1},C_0=1\)其中公式 \(3\) 表明…

大模型 | VLM 初识及在自动驾驶场景中的应用

在了解 VLM 之前,先复习下 LLM。 一、LLM(Large Language Model) 大语言模型(LLM,Large Language Model)名字虽然带有语言二字,但其实并不局限于语言类场景。LLM 更多是一种统计建模的通用技术,它们主要通过自回…

CF1977 Codeforces Round 948 (Div. 2) 游记(VP)

仅做出两题,结果凭借手速拿到表现分 $1740$。省流 仅做出两题,结果凭借手速拿到表现分 \(1740\)。10.17 内含剧透,请vp后再来。 不是题解!!!!!!! 赛前 早上花了很多时间试图把 \(stars569\) 搞的数据库装好,…

别被波形“骗” 了!差分探头与无源探头测量不一致的 5 大关键因素

在电子测量领域,精确地获取电路中电信号的波形对于分析电路的工作状态、验证设计思路以及排查故障至关重要。示波器是波形测量中最常用的仪器,通常会搭配不同类型的探头使用。其中,差分探头和无源探头是比较常见的两…

2025 年展览会服务商最新推荐榜权威发布:22 年经验甄选十强品牌,助力企业参展高效决策

当前会展行业已迈入 “全链路价值创造” 新阶段,企业参展需求从单一搭建升级为 “策划 - 执行 - 转化” 全流程服务,但市场服务商资质参差不齐:传统机构多困于 “设计 + 施工” 模式,新兴品牌虽具创新力却缺乏辨识…

OpenHarmony SELinux全面技术指南:从原理到实践的系统安全防护(全网最全) - 实践

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年信息流代运营服务商权威推荐榜单:专业投放策略与效果优化服务口碑之选

2025年信息流代运营服务商权威推荐榜单:专业投放策略与效果优化服务口碑之选在数字营销快速演进的今天,信息流广告已成为企业获取目标用户的重要渠道。随着各大媒体平台算法不断升级,用户行为日趋复杂,信息流投放的…

2025 年焊把线厂家最新推荐榜:国标欧标铜芯软焊把线优质企业排行,优质品牌助力选购欧标/铜芯/软/耐高温焊把线厂家推荐

在工业制造、建筑施工等核心领域,焊把线作为焊接作业的关键连接载体,其质量直接决定作业安全、焊接精度与生产效率。当前市场上,焊把线品牌数量激增,但产品质量差距悬殊,部分产品存在导电效率低、耐候性差、易老化…

【Prompt学习技能树地图】单一思维链优化-自我一致性提示工程原理、实践与代码实现 - 教程

【Prompt学习技能树地图】单一思维链优化-自我一致性提示工程原理、实践与代码实现 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !importa…

基于MATLAB的倒立摆控制实现方案

基于MATLAB的倒立摆控制实现方案,包含PID控制与神经网络(DQN)控制的双重实现一、系统建模与基础参数 %% 倒立摆动力学参数 m = 0.1; % 摆杆质量 (kg) M = 1.0; % 小车质量 (kg) l = 0.5; % 摆杆长度 (m) g…