深度学习--概率

1 基本概率论

1.1 假设我们掷骰子,想知道1而不是看到另一个数字的概率,如果骰子是公司,那么所有6个结果(1..6),都有相同的可能发生,因此,我们可以说1发生的概率为1/6.

然而现实生活中,对于我们从工厂收到的真实骰子,我们需要检查它是否有瑕疵,唯一办法就是多投掷骰子对于每个骰子观察到[1.2...6]概率随着投掷次数增加越来越接近1/6.

导入必要的

%matplotlib inline

import torch

from torch.distributions import multinomial

from d2l import torch as d2l

统计学中我们把概率分布中抽取样本过程称为抽样笼统地说可以吧分布看作是概率分配稍后我们给出更加正式定义概率分配给一些离散选择分布称为多项分布

为了抽样一个样本掷骰子我们只需要输入一个概率向量输出是另一个相同长度的向量索引i采样结果i出现次数

fair_probs = torch.ones([6])/8;

multinomial.Multinomial(), fair_probs).sample()

tensor(0,1,0,0,0,0);

估计一个骰子公平性我们希望同一分布中生成多个样本如果pythonfor循环完成这个任务速度慢得惊人因此我们使用深度学习框架函数同时抽取多个样本得到我们想要任何形状独立样本数组

multinomial.Multinomial(10,fair_probs).sample()

tensor([1,1,2,1,3,2]);

现在我们知道如何骰子进行抽样我们可以模拟1000投掷然后我们可以统计1000投掷每个数组投中多少次具体来说我们计算相对频率作为真实概率估计。

将结果存储32浮点进行除法

counts=multinomial.Multinomial(1000, fair_probs).sample();

counts / 1000;

tensor([0.1500,0.1770,0.1540,0.1000,0.1790,0.1600]);

因为我们从一个公平骰子生成数据我们知道每个结果都有真实概率1/6约为0.167所以上面输出估计值看起来不错

我们也可以看到这些概率如何随着时间推移收敛真实概率我们进行500实验抽取10样本

每条实线对应骰子6一个并给出骰子实验出现估计概率当我们更多实验获得更多数据6实体曲线真实概率收敛

概率论公理

处理骰子掷出结果我们集合S=(1,2,3,4,5,6)称为样本空间 结果空间其中每个元素都是结果事件一组样本空间随机结果例如看到5看到奇数都是掷骰子有效事件注意如果一个随机试验结果A事件A已经发生也就是说如果掷出3因为3 < {1,3,5} 我们可以说看到奇数事件发生了

概率 可以认为集合映射到真实函数给定样本空间S事件A概率表示P(A),具有一下属性

1 对于任意事件A概率不会负数P(A) >= 0

2 整个样本空间概率1P(S) = 1

3 序列任意一个事件发生概率等于他们各自发生概率

随机变量

在我们掷骰子随机试验中我们引入随机变量random variable概率随机变量几乎可以任何数值并且可以随机试验一组可能性一个考虑一个随机变量X掷骰子样本空间S={1,2,3,4,5,6} 我们可以事件看到一个5

表示{X=5}X=5概率表示P{X=5}或者P(X=5) 通过P(X=a) 我们可以区分随机变量XX可以然而这可能导致繁琐表示为了简化符号一方面我们可以P(X) 表示随机变量X分布(distribution) 分布告诉我们X取得某一概率另一方面我们可以简单P(a) 表示随机变量取值a概率由于概率论事件来自样本空间一组结果因此我们可以随机变量指定取值范围例如P(1<<X<<3)表示事件(1<<X<<3) (X=1,2,3)概率等价P(1<<X<<3)表示随机变量X{1,2,3}概率

离散随机变量连续(continnuous) 随机变量之间微妙区别现实生活中测量两个人是否具有相同身高没有太大意义如果我们进行足够精确测量最终会被发现这个星球没有两个人具有完全相同身高在这种情况下询问某人身高是否落入给定区间比如是否1.79-1.81更有意义我们这个看到某个数值可能性量化密度(density)身高恰好1.8概率为0 但是密度不是0在任何两个不同身高之间区间我们都有非零概率其余部分我们考虑离散空间概率连续随机变量概率可以参考本书英文附录

2.6.2 处理多个随机变量

很多时候我们会考虑多个随机变量比如我们可能需要疾病症状之间关系建模给定一个疾病一个症状比如流感咳嗽某个概率存在或者不存在某个患者身上我们需要估计这些概率以及概率之间关系以便我们可以运用我们推断实现更好医疗服务

再举一个例子图像包含数百万像素因此数百万随机变量在许多情况下图像附带一个标签label标识图像中对象我们也可以标签视为一个随机变量我们甚至可以所有数据视为随机变量例如位置时间光圈焦距ISO距离相机类型所有这些都是联合发生随机变量当我们处理多个随机变量会有若干变量是我们感兴趣

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/898726.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kaggle上经典泰坦尼克项目数据分析探索

之前了解在kaggle上这个项目很火&#xff0c;最近想要加强一下python数据分析&#xff0c;所以在kaggle上找到这个项目进行学习探索&#xff0c;下面是将一些学习资料以及过程整理出来。 一、首先我们了解一下项目背景以及如何找到这个项目。 kaggle项目地址: https://www.k…

《深度剖析:鸿蒙系统不同终端设备的UI自适应布局策略》

在万物互联的时代&#xff0c;鸿蒙系统以其独特的分布式理念和强大的技术架构&#xff0c;迅速在智能终端领域崭露头角。随着鸿蒙生态的不断壮大&#xff0c;越来越多的开发者投身其中&#xff0c;致力于为用户打造丰富多样的应用体验。然而&#xff0c;如何让应用在不同终端设…

计算机网络的软件、硬件和组成

&#xff11;.计算机网络的组成 计算机网络是一个十分复杂的系统&#xff0c;在逻辑上可以分为完成数据通信的通信子网和进行数据处理的资源子网两个部分。 通信子网 通信子网提供网络通信的功能&#xff0c;可以完成网络主机之间的数据传输、交换、通信控制和信号变换等通信…

告别低效人工统计!自动计算计划进度

实时监控任务进度一直是项目管理中的一项巨大挑战。 人工统计方式不仅耗时耗力&#xff0c;而且往往由于信息传递的延迟和人为误差&#xff0c;导致无法实时获得准确的项目进展信息。 这种不准确性可能掩盖潜在的风险点&#xff0c;从而影响项目的整体进度和成果。 Ganttable …

楼宇自控系统的结构密码:总线与分布式结构方式的差异与应用

在现代建筑中&#xff0c;为了实现高效、智能的管理&#xff0c;楼宇自控系统变得越来越重要。它就像建筑的 智能管家&#xff0c;可自动控制照明、空调、通风等各种机电设备&#xff0c;让建筑运行更顺畅&#xff0c;还能节省能源成本。而在楼宇自控系统里&#xff0c;有两种关…

OpenWrt开发第4篇:设置开发板的IP-基于Raspberry Pi 4B开发板

文/指尖动听知识库-谷谷 文章为付费内容,商业行为,禁止私自转载及抄袭,违者必究!!! 文章专栏:Openwrt开发-基于Raspberry Pi 4B开发板 有时候开发过程中经常会使用其他路由器,很多时候固件烧上去之后板子IP基本都是192.168.1.1,这时就需要修改板子的IP,下面介绍一下板…

Node.js系列(4)--微服务架构实践

Node.js微服务架构实践 &#x1f504; 引言 微服务架构已成为构建大规模Node.js应用的主流选择。本文将深入探讨Node.js微服务架构的设计与实现&#xff0c;包括服务拆分、服务治理、通信机制等方面&#xff0c;帮助开发者构建可扩展的微服务系统。 微服务架构概述 Node.js…

Docker逃逸

判断是否再docker中 1.ls -a / (查看c根目录查看是否有docker配置文件) 2.查看进程 如果在要逃逸到真实环境中&#xff1a; 特权模式进行docker逃逸&#xff1a;管理员执行eddocker run--privileg&#xff0c;如何判断是否是特权模式&#xff08;&#xff09; 特权模式以…

Vite管理的Vue3项目中monaco editer的使用以及组件封装

文章目录 背景环境说明安装流程以及组件封装引入依赖封装组件 外部使用实现效果 v-model实现原理 背景 做oj系统的时候,需要使用代码编辑器,决定使用Monaco Editor&#xff0c;但是因为自身能力问题&#xff0c;读不懂官网文档&#xff0c;最终结合ai和网友的帖子成功引入&…

pdf文件分页按需查看

pdf预览本来打算粗暴点&#xff0c;一次性查看全部&#xff0c;但是一个pdf四五百页导致手机端查看超出内存直接崩掉&#xff0c;崩掉会导致页面疯狂刷新&#xff0c;所以不得不进行优化 解决思路大致如下&#xff1a; canvas转为blob格式以图片的形式加载在页面&#xff08;B…

算力100问☞第92问:为什么各地热衷建设算力中心?

目录 1、宏观分析 2、政府角度分析 3、投资者角度分析 在数字化浪潮中,各地对算力中心建设的热情高涨,这一现象背后潜藏着诸多深层次的原因,涵盖了经济、科技、社会等多个维度,且彼此交织,共同驱动着这一发展趋势。 1、宏观分析 从经济结构转型的底层逻辑来看,全球经…

Redis 内存管理

Redis 内存管理 1. Redis 给缓存数据设置过期时间的作用 给缓存数据设置过期时间&#xff08;TTL, Time-To-Live&#xff09;有以下几个重要作用&#xff1a; (1) 自动释放内存 避免缓存数据无限增长&#xff0c;导致 Redis 内存溢出。例如&#xff0c;在 会话管理、短连接…

PyCharm中使用pip安装PyTorch(从0开始仅需两步)

无需 anaconda&#xff0c;只使用 pip 也可以在 PyCharm 集成环境中配置深度学习 PyTorch。 本文全部信息及示范来自 PyTorch 官网。 以防你是super小白&#xff1a; PyCharm 中的命令是在 Python Console 中运行&#xff0c;界面左下角竖排图标第一个。 1. 安装前置包 numpy …

掌握新编程语言的秘诀:利用 AI 快速上手 Python、Go、Java 和 Rust

网罗开发 &#xff08;小红书、快手、视频号同名&#xff09; 大家好&#xff0c;我是 展菲&#xff0c;目前在上市企业从事人工智能项目研发管理工作&#xff0c;平时热衷于分享各种编程领域的软硬技能知识以及前沿技术&#xff0c;包括iOS、前端、Harmony OS、Java、Python等…

如何理解java中Stream流?

在Java中&#xff0c;Stream 是 Java 8 引入的一个强大API&#xff0c;用于处理集合&#xff08;如 List、Set、Map 等&#xff09;数据的流式操作。它提供了一种声明式、函数式的编程风格&#xff0c;可以高效地进行过滤、映射、排序、聚合等操作。 Stream 的核心概念 流&…

【Vitis AIE】FPGA快速部署ConvNet 示例MNIST数据集

AIE-ML 上的 MNIST ConvNet 版本&#xff1a;Vitis 2024.2 简介 本教程在 AMD VersalTM 自适应 SoC AIE-ML 上实现了一个卷积神经网络分类器&#xff0c;用于识别来自 MNIST 数据库 的手写数字。目标是说明如何将一个简单的机器学习示例分区和向量化到 Versal AI 引擎。MNIS…

ubuntu桌面图标异常——主目录下的所有文件(如文档、下载等)全部显示在桌面

ubuntu桌面图标异常 问题现象问题根源系统级解决方案方法一:全局修改(推荐多用户环境)方法二:单用户修改(推荐个人环境)操作验证与调试避坑指南扩展知识参考文档问题现象 主目录文件异常显示 用户主目录(如/home/user/)下的所有文件(如文档、下载等)全部显示在桌面,…

OceanBase 4.3.3 AP 解析:应用 RoaringBitmaps 类型处理海量数据的判重和基数统计

对于大数据开发人员而言&#xff0c;处理海量数据的判重操作和基数统计是常见需求&#xff0c;而 RoaringBitmap类型及其相关函数是当前非常高效的一种解决方案&#xff0c;许多大数据库产品已支持RoaringBitmap类型。OceanBase 4.3.3版本&#xff0c;作为专为OLAP场景设计的正…

W25Qxx

概述 FLASH FLASH是一种是非易失性存储器&#xff0c;即掉电后不会丢失数据&#xff0c;这和RAM&#xff08;随机存储器&#xff09;不同。 FLASH比起同作用的EEPROM有价格低的优点 FLASH的擦除操作是以扇区为单位的&#xff08;比起EEPROM来说操作较为不方便&#xff09; 芯片…

(滑动窗口)算法训练篇11--力扣3.无重复字符的最长字串(难度中等)

目录 1.题目链接&#xff1a;3.无重复字符的最长字符 2.题目描述&#xff1a; 3.解法(滑动窗口)&#xff1a; 1.题目链接&#xff1a;3.无重复字符的最长字符 2.题目描述&#xff1a; 给定一个字符串 s &#xff0c;请你找出其中不含有重复字符的 最长 子串 的长度。 示例…