北京网站建设学习泰安58同城二手房出售信息
web/
2025/9/30 2:42:19/
文章来源:
北京网站建设学习,泰安58同城二手房出售信息,郴州网站建设解决方案,汕头网站建设公司哪个好1 基本概率论 1.1 假设我们掷骰子#xff0c;想知道1而不是看到另一个数字的概率#xff0c;如果骰子是公司#xff0c;那么所有6个结果(1..6),都有相同的可能发生#xff0c;因此#xff0c;我们可以说1发生的概率为1/6. 然而现实生活中#xff0c;对于我们从工厂收到的… 1 基本概率论 1.1 假设我们掷骰子想知道1而不是看到另一个数字的概率如果骰子是公司那么所有6个结果(1..6),都有相同的可能发生因此我们可以说1发生的概率为1/6. 然而现实生活中对于我们从工厂收到的真实骰子我们需要检查它是否有瑕疵唯一的办法就是多投掷骰子对于每个骰子观察到的[1.2...6]的概率随着投掷次数的增加越来越接近1/6. 导入必要的包 %matplotlib inline import torch from torch.distributions import multinomial from d2l import torch as d2l 在统计学中我们把从概率分布中抽取样本的过程称为抽样笼统地说可以吧分布看作是概率的分配稍后我们将给出更加正式的定义将概率分配给一些离散选择的分布称为多项分布。 为了抽样一个样本掷骰子我们只需要输入一个概率向量输出是另一个相同长度的向量在索引i处的值时采样结果i出现的次数。 fair_probs torch.ones([6])/8; multinomial.Multinomial(), fair_probs).sample() tensor(0,1,0,0,0,0); 在估计一个骰子的公平性时我们希望同一分布中生成多个样本如果用python的for循环完成这个任务速度回慢得惊人因此我们使用深度学习框架函数同时抽取多个样本以得到我们想要的任何形状的独立样本数组。 multinomial.Multinomial(10,fair_probs).sample() tensor([1,1,2,1,3,2]); 现在我们知道如何对骰子进行抽样我们可以模拟1000次投掷然后我们可以统计1000次投掷后每个数组呗投中了多少次具体来说我们计算相对频率以作为对真实概率的估计。 将结果存储为32位浮点数以进行除法。 countsmultinomial.Multinomial(1000, fair_probs).sample(); counts / 1000; tensor([0.1500,0.1770,0.1540,0.1000,0.1790,0.1600]); 因为我们是从一个公平的骰子中生成的数据我们知道每个结果都有真实的概率1/6约为0.167所以上面输出的估计值看起来不错。 我们也可以看到这些概率如何随着时间的推移收敛的真实概率我们进行500组实验每组抽取10个样本。 每条实线对应骰子的6个值的一个并给出骰子的每组实验后出现值的估计概率当我们同过更多的实验获得更多的数据时这6条实体曲线向真实概率收敛。 一 概率论公理 在处理骰子的掷出结果时我们将集合S(1,2,3,4,5,6)称为样本空间 或结果空间其中每个元素都是结果事件时一组给定样本空间的随机结果例如看到5和看到奇数都是掷骰子的有效事件。注意如果一个随机试验的结果在A中则事件A已经发生也就是说如果掷出3点因为3 {1,3,5} 我们可以说看到奇数的事件发生了。 概率 可以呗认为是将集合映射到真实值的函数在给定的样本空间S中事件A的概率表示为P(A),具有一下属性。 1 对于任意事件A其概率不会为负数即P(A) 0 2 整个样本空间的概率为1即P(S) 1 3 序列中任意一个事件发生的概率等于他们各自发生的概率之和。 二 随机变量 在我们掷骰子的随机试验中我们引入了随机变量random variable的概率随机变量几乎可以取任何数值并且它可以在随机试验的一组可能性中取一个值考虑一个随机变量X其值的掷骰子的样本空间中S{1,2,3,4,5,6} 我们可以将事件看到一个5 表示为或{X5}或X5其概率表示为P{X5}或者P(X5) 通过P(Xa) 我们可以区分随机变量X和X可以取的值然而这可能会导致繁琐的表示为了简化符号一方面我们可以将P(X) 表示为随机变量X上的分布(distribution) 分布告诉我们X取得某一值的概率另一方面我们可以简单的用P(a) 表示随机变量取值为a的概率由于概率论中的事件是来自样本空间的一组结果因此我们可以为随机变量指定值的取值范围。例如P(1X3)表示事件(1X3) 即(X1,2,3)的概率等价的P(1X3)表示随机变量X从{1,2,3}中取值的概率。 离散随机变量和连续(continnuous) 随机变量之间存在微妙的区别现实生活中测量两个人是否具有相同的身高没有太大意义如果我们进行足够精确的测量最终会被发现这个星球上没有两个人具有完全相同的身高在这种情况下询问某人的身高是否落入给定的区间比如是否在1.79米-1.81米更有意义。我们将这个看到某个数值的可能性量化为密度(density)身高恰好为1.8米的概率为0 但是密度不是0在任何两个不同身高之间的区间我们都有非零的概率。在本节的其余部分中我们将考虑离散空间中的概率连续随机变量的概率可以参考本书英文附录。 2.6.2 处理多个随机变量 很多时候我们会考虑多个随机变量比如我们可能需要对疾病和症状之间的关系建模。给定一个疾病和一个症状比如流感和咳嗽以某个概率存在或者不存在于某个患者身上。我们需要估计这些概率以及概率之间的关系以便我们可以运用我们的推断来实现更好的医疗服务。 再举一个例子图像包含数百万像素因此有数百万个随机变量。在许多情况下图像会附带一个标签label以标识图像中的对象。我们也可以将标签视为一个随机变量。我们甚至可以将所有元数据视为随机变量例如位置。时间光圈焦距ISO值对距离和相机类型所有这些都是联合发生的随机变量。当我们处理多个随机变量时会有若干变量是我们感兴趣的。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/84212.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!