(十七)如何学习统计学基础知识(学习路线)

统计学是数据科学的基本支柱。统计学的目的是帮助你理解数据并从中得出有意义的结论。在数据科学中,统计学在理解数据模式和趋势、做出预测和检验假设方面起着至关重要的作用。

(一) 数据科学统计学习路线图

本文为学习统计学并将其应用于数据科学提供了清晰、结构化的路径。

1)从描述性统计开始

首先学习描述性统计的基础知识,包括平均值、中位数、众数和标准差等指标,以及直方图、条形图和散点图等图表。这将为理解更高级的主题奠定基础。

2)学习概率

概率是统计学的重要组成部分,了解概率可以帮助您理解更复杂的概念。掌握概率分布的基本知识,包括正态分布、二项分布和泊松分布。

3)学习推论统计

学习描述统计和概率后,继续学习推论统计。从假设检验开始,包括 t 检验和方差分析,然后学习回归分析,包括简单线性回归和多元回归。

4)学习高级主题

接下来,探索统计学中的高级主题,包括机器学习、贝叶斯统计和时间序列分析。

5)使用真实数据进行练习

为了更深入地了解统计数据,使用真实数据进行练习非常重要。你可以在网上找到公开可用的数据集。

6)保持最新状态

统计学是一个快速发展的领域,了解最新技术和发展非常重要。你可以通过参加会议、阅读学术期刊和参与在线论坛来做到这一点。

(二) 概率论

概率论为做出预测和理解与这些预测相关的不确定性提供了框架。以下是与数据科学相关的一些重要概率概念:

1)随机变量

随机变量是可以随机取不同值的变量。在数据科学中,它用于模拟事件的不确定结果。随机变量有两种类型:离散变量和连续变量。

2)概率分布

概率分布是描述随机变量所有可能结果的概率的函数。概率分布有多种类型,包括正态分布、泊松分布和伯努利分布。

3)贝叶斯定理

贝叶斯定理是概率论中的一个基本概念,它描述了如何根据新证据更新我们对假设的信念。在数据科学中,它用于更新对模型参数的信念,根据新数据进行预测,并了解与这些预测相关的不确定性。

4)条件概率

条件概率是假设另一事件发生时某事件发生的概率。在数据科学的背景下,它用于对变量之间的关系进行建模,根据新数据进行预测,并了解与这些预测相关的不确定性。

5)最大似然估计(MLE)

MLE 用于估计统计模型的参数,如回归模型、分类模型和其他统计模型。

6)假设检验

假设检验是一种基于样本数据检验总体参数主张的统计方法。它用于检验模型参数主张、比较模型和验证预测。

这些只是与数据科学相关的一些重要概率概念。 更好地理解它们的最佳方法是深入研究它们并练习将它们应用于现实世界的数据。

(三) 集合论

集合论是数理逻辑的一个分支,为数学、计算机科学和数据科学中的许多概念提供了基础。以下是一些重要的概念:

1)集合

集合是一组称为元素的对象的集合,这些元素被视为单个实体。它可以是有限的,也可以是无限的,并且可以包含任何类型的元素,包括数字、字符串和其他集合。

2)集合运算

集合运算(例如并集、交集和补集)用于组合或操作集合。它们用于操作数据,例如根据某些标准组合或排除观察结果。

3)维恩图

维恩图是集合及其关系的图形表示。它们用于直观地表示数据关系并帮助识别模式或趋势。

4)笛卡尔积

两个集合的笛卡尔积是所有有序对 (a, b) 的集合,其中 a 是其中一个集合的元素,b 是另一个集合的元素。在数据科学中,笛卡尔积用于通过组合来自多个来源的数据来创建新的数据集。

5)幂集

集合的幂集是该集合的所有子集的集合,包括空集和集合本身。它用于生成所有可能的数据组合,并用于组合优化问题。

6)分区

集合的分区是将集合划分为不相交的子集,这些子集共同构成集合。它用于将数据划分为子集以供进一步分析,例如创建分层样本以进行假设检验。

(四) 描述性统计

统计学有两个主要分支:描述统计学和推断统计学。描述统计学涉及总结和描述数据,而推断统计学涉及根据数据进行预测和得出结论。在数据科学中,这两个分支都很重要。

描述性统计提供了一种总结和描述大型复杂数据集的方法。它在以下方面发挥着关键作用:

1)数据探索

描述性统计提供了一种快速简便的方法来探索和总结大型数据集。例如,平均值、中位数和众数等指标提供了可用于描述数据集集中趋势的汇总统计数据。此外,直方图、箱线图和散点图等图表可以直观地表示数据,可用于识别数据中的模式和关系。

2)数据清理

描述性统计数据还可用于识别异常值、缺失值和其他需要在进行进一步分析之前解决的数据问题。通过使用最小值、最大值和四分位数等指标,数据科学家可以快速识别超出正常范围的数据点并采取适当的措施。

3)数据呈现

描述性统计是一种以清晰简洁的方式呈现数据的强大工具。通过使用平均值和标准差等指标来汇总数据,数据科学家可以以其他人容易理解的方式传达复杂的数据。直方图、条形图和折线图等图表也可用于以引人入胜且易于理解的方式直观地表示数据。

4)数据分析

描述性统计为更高级的数据分析方法提供了基础。例如,相关性和协方差可用于识别变量之间的关系。同时,假设检验可用于根据样本数据对总体进行推断。

(五) 推断性统计

推断性统计提供了一种基于样本数据对总体进行概括的方法。它是进行假设检验、模型构建、估计和决策的强大工具。

1)假设检验

推论统计学提供了基于样本数据检验有关总体假设的方法。例如,假设检验可用于确定两组的平均值之间是否存在显著差异,或者两个变量之间是否存在关系。

2)模型构建

推论统计学提供了构建模型的方法,可用于根据样本数据对总体进行预测或推断。例如,对因变量和一个或多个自变量之间的关系进行建模。同时,决策树和随机森林等机器学习算法可用于根据大型复杂数据集进行预测。

3)估计

推论统计能够根据样本数据估计总体参数。例如,置信区间可用于估计可能包含真实总体参数的数值范围,而点估计则提供总体参数的单一数值估计。

4)决策

推论统计还提供了基于样本数据做出明智决策的工具。例如,统计显著性检验可用于确定变量之间的关系是真实的还是偶然的,而成本效益分析可用于根据预期成本和收益确定最佳决策。

 

统计学是数据科学的重要组成部分,掌握基础知识至关重要。学习统计学的方法有很多,包括在线课程、处理真实数据和探索 EDA。请记住,学习统计学需要时间和练习,但只要有奉献精神以及正确的资源和支持,你就能成为一名成功的数据科学家。

以上为全部内容,下期再见,bye!

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/37844.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用 SPM 插件从 Pkl 配置文件生成 Swift 接口

文章目录 前言示例展示 Pkl 配置生成 Swift 绑定手动安装和使用 pkl-gen-swift创建 SPM 命令插件加载 Pkl 配置总结前言 Pkl(全称为 Pickle)是苹果推出的一种全新的专用于配置的编程语言。它允许开发人员通过类型和内置验证安全、直观地设计数据模型。 作为苹果语言,Pkl 有…

Python容器 之 列表--下标和切片

列表的切片 得到是 新的列表字符串的切片 得到是 新的字符串 如果下标 不存在会报错 list1 [1, 3.14, "hello", False] print(list1)# 获取 列表中 第一个数据 print(list1[0]) # 1# 获取列表中的最后一个数据 print(list1[-1]) # [False]# 获取中间两个数 即 3.1…

3.2ui功能讲解之graph页面

本节重点介绍 : graph页面target页面flags页面status页面tsdb-status页面 访问地址 $ip:9090 graph页面 autocomplete 可以补全metrics tag信息或者 内置的关键字 ,如sum聚合函数table查询 instante查询, 一个点的查询graph查询调整分辨率 resolutio…

记录:有趣的C#多元运算符 ? : 表达式写法

有时候用 if //...Whatre you she wanna go else if //...do do do else //...and i know something just like this... 感觉代码太多了怎么优雅的、高端的替换? 看个高端的栗子菊: LedCOM["parity"] ledData[4] "N" ? …

Study--Oracle-05-Oracler体系结构

一、oracle 体系概览 Oracle数据库的体系结构通常包括以下主要组件: 1、实例(Instance):运行数据库的软件环境,包括内存结构(SGA)和进程结构(Background Processes and User Proces…

Django 一对多关系

1,创建 Django 应用 Test/app9 django-admin startapp app9 2,注册应用 Test/Test/settings.py 3,添加应用路由 Test/Test/urls.py from django.contrib import admin from django.urls import path, includeurlpatterns [path(admin/,…

《每天5分钟用Flask搭建一个管理系统》 第10章:前端集成

第10章:前端集成 10.1 前端技术概述 前端技术指的是构建Web应用用户界面所使用的技术,包括HTML、CSS和JavaScript。现代Web开发中,前端框架如React、Vue.js和Angular等被广泛使用。 10.2 AJAX与Flask的集成 AJAX(Asynchronous…

数据资产安全策略的定制化之道:深入了解各企业独特需求,量身打造个性化的数据资产保护方案,确保数据安全无虞,助力企业稳健发展

目录 一、引言 二、企业数据资产安全现状分析 (一)数据安全风险多样化 (二)传统安全措施难以满足需求 (三)企业数据资产安全意识亟待提高 三、定制化数据资产安全策略的重要性 (一&#…

natvicat为什么连不上linux上的mysql?

老规矩,废话不多说,直接上教程。 号外,数据库管理工具领域的知名品牌Navicat,推出其免费版本——Navicat Premium Lite,用户可从Navicat官网下载体验这款软件。 https://www.navicat.com.cn/download/navicat-premium-…

【HALCON】如何实现hw窗口自适应相机拍照成像的大小

前言 在开发一个喷码检测软件的时候碰到相机成像和hw窗体的大小不一致,hw太小显示不完全成像的图片,这使得成像不均匀,现场辨别起来比较不直观,因此需要对其进行一个调整。 解决 省略掉读取图片的环节,我们只需要将…

别再用this.$forceUpdate()了!—性能优化篇

文章目录 别再用this.$forceUpdate()了!—性能优化篇🎈介绍🧨弊端注意事项 🎆解决实例 别再用this.$forceUpdate()了!—性能优化篇 起因是接手公司之前外包的项目做项目优化,代码看着一言难尽,…

CGI面试题及参考答案

什么是CGI?它在Web服务器与应用程序之间扮演什么角色? CGI(Common Gateway Interface) 是一种标准协议,它定义了Web服务器与运行在服务器上的外部程序(通常是脚本或应用程序)之间的通信方式。简单来说,CGI充当了一个桥梁,使得Web服务器能够将用户的请求传递给后端程序…

ruoyi—cloud 新建模块+生成代码

1.复制一个模块——修改名字 2.打开模块下的yml文件,修改端口号和名字 (1)修改一个名字 (2)打开yml文件 (3)修改端口号,不要重复 (4)改名字和模块一致 3.…

41、web基础和http协议

web基础与http协议 一、web web:就是我们所说得页面,打开网页展示得页面。(全球广域网,万维网) world wide webwww 分布式图形信息系统 http:超文本传输协议 https:加密的超文本传输协议…

猫冻干可以天天喂吗?喂冻干前要了解的必入主食冻干榜单

近年来,冻干猫粮因其高品质而备受喜爱,吸引了无数猫主人的目光,对于像我这样的养猫达人来说,早已尝试并认可了冻干喂养。然而,对于初入养猫行列的新手们来说,可能会有疑问:什么是冻干猫粮&#…

Qt——界面优化

目录 QSS 基本语法 QSS 设置方式 指定控件样式设置 全局样式设置 文件加载样式表 Qt Designer 编辑样式 选择器 子控件选择器 伪类选择器 样式属性 盒模型 控件样式 按钮 复选框 单选框 输入框 列表 菜单栏 登录界面 绘图 概念 绘制形状 绘制线段 绘制…

微信换手机号了怎么绑定新手机号?

微信换手机号了怎么绑定新手机号? 1、在手机上找到并打开微信; 2、打开微信后,点击底部我的,并进入微信设置; 3、在微信设置账号与安全内,找到手机号并点击进入; 4、选择更换手机号&#xff0c…

【代码随想录算法训练Day52】LeetCode 647. 回文子串、LeetCode 516.最长回文子串

Day51 动态规划第十三天 LeetCode 647. 回文子串 dp数组的含义:i到j的子串是否是回文的,是的话dp[i][j]1 递推公式:if(s[i]s[j]) i j 一个元素 是回文的 |i-j|1 两个元素 是回文的 j-i>1 判断dp[i1][j-1] 初始化:全部初始化成…

在代理服务器环境中配置pip源的全面指南

引言 Python的包管理工具pip是开发者和系统管理员常用的工具之一,用于安装和管理Python库。然而,在某些网络环境下,如公司内网或某些国家,直接访问pip默认源可能会受到限制。此外,通过代理服务器访问可以提高访问速度…

淘系-万相台无界实操运营课:淘系 付费工具课(40节课)

课程目录 01_万相台无界系统性忖费推广思维.mp4 02_万相台无界七大推广场景详解.mp4 03关键词推广计划之标准计划搭建技巧.mp4 04_关键词推广之智能计划推广技巧.mp4 05_关键词推广之趋势选品计划推广技巧.mp4 06关键词推广之智能选品计划推广技巧.mp4 07_非标品的关键词…