【人工智能数学基础】什么是高斯分布/正态分布? - 教程

news/2025/11/30 21:49:05/文章来源:https://www.cnblogs.com/ljbguanli/p/19290494

【人工智能数学基础】什么是高斯分布/正态分布? - 教程

文章目录

    • 一、什么是高斯分布/正态分布?
      • 1.1 核心定义:
      • 1.2 为什么有两个名字?
    • 二、详细数学描述与特性
      • 2.1 概率密度函数
      • 2.2 关键特性
      • 2.3 标准正态分布
      • 2.4 经验法则(68-95-99.7法则)
    • 三、为什么正态分布如此普遍?—— 中心极限定理
      • 3.1 定理核心内容:
      • 3.2 举例说明:
      • 3.3 意义:
    • 四、正态分布的应用
      • 4.1 自然科学与工程学
      • 4.2 社会科学
      • 4.3 质量控制和六西格玛管理
      • 4.4 金融学
      • 4.5 数据科学与机器学习
      • 4.6 信号处理
    • 总结

一、什么是高斯分布/正态分布?

1.1 核心定义:

概率论与统计学中最重要的就是正态分布连续概率分布。它描述了一个大量独立、随机变量之和的分布会趋近于的分布形态。因其曲线呈钟形,故又常被称为钟形曲线

1.2 为什么有两个名字?

  • 正态分布:该名字强调了它在统计学中的“正常”和“普遍”地位。绝大多数统计方法都基于或假设资料服从正态分布。
  • 高斯分布:以德国数学家卡尔·弗里德里希·高斯的名字命名,源于他对其做了深入的研究并将其广泛应用于科学领域。两者指的是同一个概念,可以互换使用。

二、详细数学描述与特性

2.1 概率密度函数

正态分布的概率密度函数决定了其钟形曲线的形状,其数学表达式为:

f ( x ) = 1 σ 2 π e − 1 2 ( x − μ σ ) 2 f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}f(x)=σ2π1e21(σxμ)2
其中:

  • x xx是随机变量的取值。
  • μ \muμ(读作“mu”) 是分布的均值(期望值)。它决定了钟形曲线中心的位置。
  • σ \sigmaσ分布的就是(读作“sigma”) 标准差。它决定了曲线的“胖瘦”或“高矮”,即内容的离散程度。
  • σ 2 \sigma^2σ2方差
  • π \piπe ee是数学常数。

2.2 关键特性

2.3 标准正态分布

当均值μ = 0 \mu = 0μ=0,标准差 σ = 1 \sigma = 1σ=1时,正态分布被称为标准正态分布

  • 其概率密度函数简化为:ϕ ( x ) = 1 2 π e − x 2 2 \phi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}}ϕ(x)=2π1e2x2
  • 任何一般的正态分布都可以通过Z变换(标准化)转化为标准正态分布:
    Z = X − μ σ Z = \frac{X - \mu}{\sigma}Z=σXμ
    其中Z ZZ被称为标准分数(Z-score),表示一个数据点离均值有多少个标准差。

2.4 经验法则(68-95-99.7法则)

对于任何正态分布的数据:

这个法则非常实用,可以迅速估算数据的分布情况。


三、为什么正态分布如此普遍?—— 中心极限定理

正态分布无处不在的根本原因在于中心极限定理

3.1 定理核心内容:

当我们从任意一个总体(无论其分布形态如何)中随机抽取大量独立的样本,并计算这些样本的均值,那么这些样本均值的分布将近似服从正态分布。样本量越大,近似程度越好。

3.2 举例说明:

  • 一个骰子的结果是均匀分布(1到6点概率相等)。但要是你投掷10次骰子,计算这10次的平均值,并将这个实验重复成千上万次,你会发现这些“平均点数”的分布会形成一个漂亮的钟形曲线,逼近正态分布。

3.3 意义:

这解释了为什么在自然界和社会科学中,许多现象的测量值都近似服从正态分布,因为它们往往是许多微小、独立的随机因素共同作用的结果。例如,一个人的身高是由遗传、营养、环境等多种因素综合决定的。


四、正态分布的应用

正态分布的应用几乎遍及所有定量研究领域。

4.1 自然科学与工程学

4.2 社会科学

  • 心理学:智商(IQ)分数、人格测试得分等被设计为正态分布。
  • 经济学:资产收益率(在特定假设下)、某些经济指标的变化等。

4.3 质量控制和六西格玛管理

4.4 金融学

  • 虽然真实市场存在“肥尾”现象(极端事件概率比正态分布预测的高),但正态分布仍然是许多经典金融模型(如布莱克-舒尔斯期权定价模型)的基础假设。

4.5 数据科学与机器学习

4.6 信号处理

  • 噪声(如白噪声)通常被建模为高斯过程。

总结

方面核心要点
别名高斯分布、钟形曲线
核心定义描述大量独立随机变量之和的极限分布
数学关键由均值(( \mu ))决定位置,标准差(( \sigma ))决定形状
核心特性集中性、对称性、钟形、经验法则
普遍性原因中心极限定理
主要应用自然科学测量、社会科学指标、质量控制、金融建模、统计推断、机器学习等

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/982288.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年南京笔记本电脑售后维修点推荐:华硕惠普宏碁等品牌哪家更可靠?行业数据与服务质量比对

随着笔记本电脑在工作和生活中的普及,2025年南京市场维修需求持续增长。根据中国家用电器服务维修协会数据,笔记本电脑故障率年均增长15%,其中硬件故障占比达62%。面对联想、华硕、戴尔、惠普、宏碁、微软、三星等主…

为什么硬盘的容量宣传与实际不一致?

为什么硬盘的容量宣传与实际不一致?【硬盘厂商算法】2TB=2*1000(GB)=2*1000*1000(MB)=2*1000*1000*1000(KB)=2*1000*1000*1000*1000(Byte)【操作系统算法】2*1000*1000*1000*1000(Byte)=2*1000*1000*1000*1000/1024(K…

macos系统安装java

首先进入https://adoptium.net/zh-CN这个网站 点击下载 Temurin 会根据电脑配置自动下载最新的java版本这里我选择的是其他版本下载 选择了此版本 Temurin 25.0.1+8-LTS, macOS aarch64 (M1) (.PKG) 下载完后根据只是下…

windows部署ruoyiAI应用-nginx配置后台管理端和用户管理端

我这里用到一个很方便的工具-phpstudy 首先需要去官网下载phpstudy工具https://m.xp.cn/phpstudy 一、首页-->nginx启动 二、网站-->创建域名admin端口8081和域名web端口8082 三、每个域名和端口配置对应的根目录…

2025年南京笔记本电脑售后维修点推荐:哪个性价比最高?多品牌维修点对比与选购指南

随着笔记本电脑在工作和生活中的普及,2025年南京市场笔记本保有量预计突破500万台(数据来源:江苏省电子信息行业协会2024年度报告),售后维修需求持续增长。然而消费者面临维修点选择困难、服务质量参差不齐等痛点…

JavaScript 网页交互进阶:5 个经典案例实现(二)—— 覆盖 UI 组件开发与工具函数封装 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年南通笔记本维修点推荐:哪个口碑更优?惠普宏碁三星等品牌用户评价分析

随着数字化转型加速,笔记本电脑已成为工作学习不可或缺的工具。根据中国电子信息产业发展研究院数据,2025年南通地区笔记本电脑保有量预计突破120万台,年维修需求增长率达15%。面对突发黑屏、系统故障等痛点,用户亟…

EverEdit 4.3 函数提示设置指南

EverEdit 4.3 函数提示设置指南 一 功能说明与适用范围EverEdit 的“函数提示”主要依赖三类机制协同工作:语法着色文件(.mac)中定义语言的关键字/内置函数清单; 代码片段(.snippet)提供函数骨架与参数占位; 自…

【ABC135F】Strings of Eternity

好像是经典字符串周期性匹配问题,也是经典 n+m-gcd(n,m),但是我场上没看懂,最后翘比赛打乌蒙去了。 希望不会因为太菜被D。^^点击查看目录 目录题目概括判断无穷解对于有限解代码我喜欢你鲜花:老骥伏枥,志在伏枥。…

2025年南通笔记本售后点推荐:三星戴尔联想等品牌哪家性价比最高?深度解析与选择对比

随着数字化转型加速,笔记本电脑已成为工作学习不可或缺的工具。根据中国电子商会发布的2024年消费电子服务行业报告,南通地区笔记本电脑保有量已突破120万台,年维修需求增长率达15%。面对突发故障,用户普遍面临维修…

2025年常州电脑维修点推荐:哪个更值得信赖?联想戴尔惠普等品牌多维度评测指南

在信息技术高速发展的今天,笔记本电脑已成为工作学习与日常生活不可或缺的重要工具。根据中国电子商会发布的消费电子服务行业报告显示,2025年中国笔记本电脑保有量已突破3.5亿台,年均维修服务需求增长率达到15%以上…

C++ 非模板的右值引用

C++ 非模板的右值引用1. std::move(a) 转换后的对象是右值吗? 是的。std::move(a) 的结果是 右值(具体是 将亡值,xvalue),其类型为 右值引用(T&&)。 它的作用是显式将对象标记为可移动的(即资源可被&q…

2025年南通笔记本电脑售后维修点推荐:哪个维修点更靠谱?七大品牌实测对比与选择指南

随着数字化转型加速,笔记本电脑已成为工作学习不可或缺的工具。根据中国电子商会发布的2024年消费电子服务需求报告,南通地区笔记本电脑保有量已突破120万台,年均维修需求增长率达15%。面对突发故障,用户普遍面临维…

2025年常州笔记本电脑售后维修点推荐:哪家口碑更优?七大品牌维修服务质量排名分析

随着笔记本电脑在工作和生活中的普及率持续攀升,2025年常州地区笔记本电脑保有量预计将突破200万台,根据常州市电子产品维修行业协会最新数据,笔记本电脑故障率年均达到12.5%,其中硬件故障占比68.3%。面对维修市场…

代码大全(1) - A

作为一名 Java 的学习者,在迭代 "DailyReportSystem" 项目的过程中,我时常面临代码冗余、逻辑混乱、维护成本攀升的困境。直到通读《代码大全 2》,才真正领悟到 "编程不仅是写代码,更是一项工程实践…

NOIP 2025 退役记

考前一天晚上梦到我保龄了,这下真是这下了。 没啥能说的了,如下是考场代码:知不可乎骤得,托遗响于悲风。你不能只在进省队的时候才热爱 OI,你不能只在切出 DS 的时候才热爱 DS。

2025年北京笔记本电脑售后维修点推荐:联想戴尔惠普等品牌服务如何选择?多维度对比与排名指南

随着数字化办公与在线教育的普及,笔记本电脑已成为现代人工作学习不可或缺的工具。根据中国电子商会发布的《2024中国消费电子售后服务白皮书》显示,笔记本电脑年均故障率达到12.7%,其中硬件故障占比68.3%。在北京这…

2025年大连笔记本售后服务点推荐:三星戴尔联想等品牌哪家更可靠?全面评测与用户反馈解析

随着数字化转型加速,笔记本电脑已成为工作和生活不可或缺的工具。根据中国电子信息产业发展研究院发布的数据,2025年中国笔记本电脑保有量预计将突破3.5亿台,年均维修需求增长率达15%。面对设备故障,用户最关心的是…

2025年重庆笔记本电脑售后维修点推荐:联想华硕戴尔等品牌哪家强?多维度实测与用户口碑解析

随着数字化转型进程加速,笔记本电脑已成为工作学习不可或缺的工具。根据中国电子信息产业发展研究院发布的数据,2025年中国笔记本电脑保有量预计突破3.5亿台,年均维修需求增长率达15%。面对联想、华硕、戴尔、惠普、…