大连建设工程信息网下载中心太原seo建站

diannao/2026/1/20 8:53:52/文章来源:
大连建设工程信息网下载中心,太原seo建站,网站和app的关系,百度手机助手网页版在进行数据分析时#xff0c;我们往往会遇到要对某个变量的影响因素进行分析的情况#xff0c;而影响一事物的因素往往是很多的。比如在化工生产中#xff0c;有温度、压力、剂量、反应时间等因素。每一因素的改变都有可能影响产品的数量和质量。我们往往要找出对产品质量有… 在进行数据分析时我们往往会遇到要对某个变量的影响因素进行分析的情况而影响一事物的因素往往是很多的。比如在化工生产中有温度、压力、剂量、反应时间等因素。每一因素的改变都有可能影响产品的数量和质量。我们往往要找出对产品质量有显著影响的那些因素。而方差分析就是根据试验的结果进行分析鉴别各个有关因素对试验结果影响的有效方法本文主要讲述如何用python中的两种方法来进行方差分析。 首先还是先简介一下方差分析。 方差分析Analysis of VarianceANOVA又称“变异数分析”或“F检验”是由罗纳德·费舍尔Ronald Aylmer Fisher发明的用于两个及两个以上样本均数差别的显著性检验其原理是认为不同处理组的均数间的差别基本来源有两个 (1) 实验条件即不同的处理造成的差异称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示记作SSa组间自由度dfa。 (2) 随机误差如测量误差造成的差异或个体间的差异称为组内差异用变量在各组的均值与该组内变量值之偏差平方和的总和表示 记作SSe组内自由度dfe。 总偏差平方和 SSt SSa SSe。 组内SSe、组间SSa除以各自的自由度组内dfe n-m组间dfam-1其中n为样本总数m为组数得到其均方MSe和MSa一种情况是处理没有作用即各组样本均来自同一总体MSa/MSe≈1。另一种情况是处理确实有作用组间均方是由于误差与不同处理共同导致的结果即各样本来自不同总体。那么MSaMSe远大于。 MSa/MSe比值构成F分布。用F值与其临界值比较推断各样本是否来自相同的总体。 然后我们再说明一下数据集。 数据集非常简单只有5组数值每组数值有4个共20个数字。分别命名为group1、group2、group3、group4和group5数值都是随意设置的没有什么要求这里大家也可以根据自己的意愿设置数据。在这里笔者专门将数据量设置得比较小这样方便观察数据的之间的差异我们的重点是方差分析的方法而这里我们主要讲的是单因素方差分析法。 group1 [29.6, 24.3, 28.5, 32.0] group2 [27.3, 32.6, 30.8, 34.8] group3 [5.8, 6.2,11.0, 8.3] group4 [21.6, 17.4, 18.3, 19.0] group5 [29.2, 32.8, 25.0, 24.2] 设u1、u2、u3、u4和u5分别是这5个样本所属总体的均值我们用单因素方差分析来检验下面的假设。 H0u1u2u3u4u5 H1u1、u2、u3、u4和u5不全相等 为了能更直观了解这5组数据我们首先手工计算一下这些数据的相关参数。这5组数据的总体情况如图1所示。图1. 所用数据的基本情况 在图1中每列数据就是一个水平这是一个统计学用语水平和就是每组4个数值的总和每组数据平均值分别是a128.6a231.375a37.825a419.075a527.8全部20个数据的平均值为A(a1a2a3a4a5)/5114.675/522.935。所以总偏差平方和为ST1616.65此值为20个数据中每个数据与A的差的平方的总和误差平方和为SE135.82此值为每组数据中每个数据与这组数据的平均值的差的平方之和效应平方和为SA1480.83此值为每组数据的平均值与A的差的平方之和也等于ST减去SE的差。由此我们可以得出本例的方差分析表如图2所示。图2. 方差分析表 图2中的因素就是各组数据间的差异这个可以是随机的也可以是人为的而误差就是每组数据的之间差异。我们可以看到本例中得到的F值为40.8848远大于查表得到的F值F0.05(4,15)其值为3.06至于F0.05(4,15)的值我们同样可以用python得出后面会有讲解。 以上就是这个例子的手工计算过程下面我们用python来计算一下该例。 方法1scipy 方法1用的库是scipy这是python中科学计算最常用的库其代码如下记得输入前面的5组数据。 from scipy import stats F, pstats.f_oneway(group1, group2, group3, group4, group5) F_teststats.f.ppf((1-0.05), 4, 15) print(F值是%.2fp值是%.9f % (F,p)) print(F_test的值是%.2f % (F_test)) if FF_test: print(拒绝原假设u1、u2、u3、u4、u5不全相等) else: print(接受原假设u1u2u3u4u5) 结果如图3所示。图3. 方法1的计算结果 scipy的单因素方差分析比较简单只要调用stats模块的f_oneway方法即可在f_oneway中输入各组数据然后会自动返回两个数值F与p第一个数值F就表示我们算出的F值和图2中的F值一样而第二个值p就是这个F值所对应的概率也就是假设检验问题中由检验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平。在这里我们既可以通过F值来判断也可以通过p值来判断因为F大于F_test落入了拒绝域所以拒绝原假设而p值也远小于α分位数这里为0.05所以也拒绝原假设。而这里的F_test就是图2中的F0.05(4,15)计算方法就是用stats.f.ppf((1-0.05), 4, 15)这里ppf的意思是Percent point function也就是百分点函数它是Cumulative distribution function累积分布函数的逆运算这里需要注意的是ppf的第一个参数要输入1-0.050.05也就是我们设定的显著性水平α其值通常取0.05而第二个和第三个参数是两个自由度这两个自由度分别是4和15其求法在前面原理部分已经讲过。 方法2statsmodels 方法2用的是python的另一个统计学库statsmodels其代码如下。 import statsmodels.api as sm import pandas as pd from statsmodels.formula.api import ols numsorted([g1, g2, g3,g4, g5]*4) datagroup1 group2 group3 group4 group5 dfpd.DataFrame({num:num, data: data}) modols(data ~ num,datadf).fit() ano_tablesm.stats.anova_lm(mod,typ2) print(ano_table) 结果如图4所示。图4. 方法2的计算结果 从图4中我们可以看到得出的结果和前面手算以及scipy的结果一样部分小数精度问题可以忽略不计图中sum_sq列就表示平方和df列就代表了自由度这里还给出了p值就是PR(F)列信息比scipy要丰富一些。 从代码上来看statsmodels也同样很简单只比scipy稍微复杂了一点但却提供了更多的信息。这里有几点要注意的。一是我们生成了一个名为num的变量和一个名为data的变量这两个都是list类型又用二者生成了名为df的pandas.DataFrame变量这样做的原因是statsmodels中普遍使用DataFrame数据格式如果使用list类型会更麻烦一些。而data是把前面group1到group5中的数据放在了一个list中num则是存放每个数据所对应的数据组信息g1就代表这个数值属于group1g2则是对应group2以此类推。这里还有一点要注意就是num中数据格式最好是字符格式的比如’a1’、‘num3’这样的不要是数字格式的比如1、3、6.9这样的因为数字格式的数据很有可能会参与计算最终的结果可能会出错。第二点是mod ols(data ~ num, datadf).fit()中的公式data ~ num很多人对这一点很困惑这种公式的使用方法来自于python的另一个库patsy其主要用于描述统计模型尤其是线性模型符号~前面的部分代表了y轴数据后面的部分代表了x轴数据根据这二者生成一个线性模型ols中第二个参数data则是要输入的数据源一般是DataFrame格式前面公式中符号~前后的名称都要是data中的列名这种方法确实有些奇怪部分原因是patsy借鉴了R语言的一些用法。第三点是ano_table sm.stats.anova_lm(mod, typ2)中typ2的意思是DataFrametyp共有3个值分别是1、2和3其中2代表了DataFrame格式。 总结 对比scipy和statsmodels这两种方法可以说是各有优势。scipy是一个通用型库其包含了科学计算的多种模块统计分析只是其中一部分而statsmodels是一个专门进行统计分析的库二者在功能上有一些差别statsmodels在统计分析上更专业一些。而scipy的语法更符合python常用的语法statsmodels的语法有些接近于R语言对初学者可能有些陌生。所以大家可以根据自己的需要来选择合适的方法。 【责任编辑庞桂玉 TEL01068476606】 点赞 0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/90022.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php网站建设教程 电子书河北软文搜索引擎推广公司

1、建立一个文件夹,如pcl_demos,里面建立一个.cpp文件和一个cmake文件 2、打开终端并进入该文件夹下,建立一个build文件夹存放编译的结果并进入该文件夹 3、对上一级进行编译 cmake .. 4、生成可执行文件 make 5、运行该可执行文件 6、可视…

网站建设装修鱼泡建筑网

一只被母羊抛弃的小羊羔,来到我们住的蒙古包。在草原母羊拒绝让小羊吃奶是常有的现象,所以在老辈人中流传着《劝奶歌》,我听过几次,曲调哀婉,让人感动。在蒙古电影《哭泣的骆驼》中有过类似的细节。老人为了让抛弃小骆驼的母驼回心…

网站广告联盟怎么做的网址大全怎么删除

题目链接:leetcode 76 1.题目 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 “” 。 注意: 对于 t 中重复字符,我们寻找的子字符串中该字符数…

美术馆网站建设要求宁波网站的建设

文章目录 1. 代码仓库2. 单源路径2.1 思路2.2 主要代码 3. 所有点对路径3.1 思路3.2 主要代码 4. 联通分量5. 环检测5.1 思路5.2 主要代码 6. 二分图检测6.1 思路6.2 主要代码6.2.1 遍历每个联通分量6.2.2 判断相邻两点的颜色是否一致 7. 最短路径问题7.1 思路7.2 代码 1. 代码…

学设计的网站都有哪些哪几个小说网站做网编拿的钱多

(Remember the Word ,LA 3942) 题目来源:https://vjudge.net/problem/UVALive-3942 题意:给定一个字符串S以及n个单词,字符用这n个单词进行拆分,输出拆分的方案数。 思路:dp字典树 可以先将这n个单词存储于字典树中&a…

域名等于网站网址吗襄阳论坛网站建设

外国友人仿照中国字谜设计了一个英文版猜字谜小游戏,请你来猜猜看吧。 字谜的迷面 puzzle 按字符串形式给出,如果一个单词 word 符合下面两个条件,那么它就可以算作谜底: 单词 word 中包含谜面 puzzle 的第一个字母。 单词 word…

网站制作步骤是什么wordpress禁止自动升级

RV32/64 特权架构 - 特权模式与指令 1 特权模式2 特权指令2.1 mret(从机器模式返回到先前的模式)2.2 sret(从监管模式返回到先前的模式)2.3 wfi(等待中断)2.4 sfence.vma(内存屏障) …

做淘宝客网站用什么程序最好东莞企业免费建站

1、基本路径法测试的概念 是一种白盒测试方法,它在程序控制流图的基础上,通过分析控制构造的环行复杂性,导出基本可执行路径集合,从而设计测试用例的方法。 要保证在测试中程序的每一个可执行语句至少执行一次 【这和语句…

中英文双语网站 滑动切换wordpress专业

笔者近期看到一则新闻:生成式人工智能岗位需求暴涨超 300%,AIGC 相关岗位的平均招聘年薪达 40 万元以上。到底什么是生成式人工智能岗位,和传统的人工智能岗又有什么区别呢?笔者今天想和大家一起聊聊这个新兴岗位。 第一波先上概…

网站建设实施网站建设 淘宝详情

Ubuntu 20.04使用 VNC远程桌面连接避坑指南 自从开始使用Ubuntu 20.04搭建深度学习服务器,就想到使用VNC远程桌面连接使用。可是之前一直使用的是Ubuntu18.04,心里想着设置应该不难,结果在配置的时候总出现无法连接的错误。下面我就分享一下…

手机代理企业网站网站显示图片标记

前言 本文基础知识部分来自于b站:分享笔记的好人儿的思维导图与王道考研课程,感谢大佬的开源精神,习题来自老师划的重点以及考研真题。此前我尝试了完全使用Python或是结合大语言模型对考研真题进行数据清洗与可视化分析,本人技术…

抚顺建设网站html简单网页代码作业

制定好的应急响应预案,只做培训还不够,还需要通过实战演 练来提高应对网络突发事件的行动力,针对网络突发事件的假想情 景,按照应急响应预案中规定的职责和程序来执行应急响应任务。 根据出现的新的网络攻击手段或其他特殊情况…

做网站的公司盐城新生活cms安卓系统下载

一,问题分析 1.理论上 iPad 是按像素点排列的,可 iPad5为什么和 iPad3差别那么大??? 2.iPad3超出边界的视图,都有一个 leading 是superview 的 leading 加上-20.感觉是这个地方有问题. 3.重新添加一下约束,去掉了那个默认的 constraint 选项,就没有那个-20的差值了.运行后发…

网站管理系统排行榜住房和城乡建设部网站评估

目录 C11的由来 命名趣事 统一的列表初始化 统一的列表初始化的一些关键点和特性: 简单测试代码示例: 示例 1:初始化内置类型和数组 示例 2:初始化类和结构体 示例 3:初始化标准库容器 声明 auto关键字 auto…

邯郸网站设计价格做花瓶的网站

QT VS环境安装后出现生成的程序can not start 问题原因: windows kit 没有配置到系统环境变量 解决方法: 添加环境变量

深圳 做网站 互联wordpress win调试

缩短JDK发布周期的原因之一是有可能推出更快的安全错误修复和增强功能。 在本文中,我们将简要回顾一下最新JDK版本中引入的主要安全增强功能。 由于这些增强功能中的大多数与TLS相关,因此必须了解TLS握手过程,如下图所示: JDK 9 …

做ppt网站大全为什么在百度搜不到我的网站

实例需求:产品清单如A列所示,现在如下统计词组词频。想必各位小伙伴都指定如何使用字典对象实现去重,进而实现单个单词的词频统计。 但是统计词组词频就没有那么简单了,为了便于演示,此处的词组只限于两个单词的组合。…

定制网站建设成本网络营销公司取名字大全

描述: 难点: 将[[‘a’,‘b’,‘c’],[‘d’,‘e’,‘f’]]输出为[“ad”, “ae”, “af”, “bd”, “be”, “bf”, “cd”, “ce”, “cf”]. 关键代码描述: 1.假设我们已经根据输入的数字得到了 rawArr [[‘a’,‘b’,‘c’],[‘d’,‘e’,‘f’]] 2. 下一步将rawArr[0…

网站主机与服务器安徽省两学一做网站专栏

2016年认证杯SPSSPRO杯数学建模 D题 NBA是否有必要设立四分线 原题再现: NBA 联盟从 1946 年成立到今天,一路上经历过无数次规则上的变迁。有顺应民意、皆大欢喜的,比如 1973 年在技术统计中增加了抢断和盖帽数据;有应运而生、力…

搭建网站运行环境网站建设企业 熊账号

手把手教你写专利申请书怎样申请专利摘要小前言(一)申请前的准备工作 1、申请前查询 2、其它方面的考虑 3、申请文件准备(二)填写专利申请系列文档 1、实际操作步骤 2、详细操作 3、经验分享、注意事项&#xf…