创世网站网络建设鑫牛元网站建设
news/
2025/10/4 21:12:12/
文章来源:
创世网站网络建设,鑫牛元网站建设,类似优酷网站建设价格,大型网站制作设计转自个人微信公众号【Memo_Cleon】的统计学习笔记#xff1a;协方差分析#xff1a;方差分析与线性回归的统一。在进行数据分析时#xff0c;有时候我们会遇到数据基线不平的情况#xff0c;比如两样本的t检验的示例#xff0c;比较Labe和Meto用药13周的降压效果#xff…转自个人微信公众号【Memo_Cleon】的统计学习笔记协方差分析方差分析与线性回归的统一。在进行数据分析时有时候我们会遇到数据基线不平的情况比如两样本的t检验的示例比较Labe和Meto用药13周的降压效果但一开始用药的时候两组舒张压的差别便有统计学意义。除了文中使用的差值比较协方差分析是一个非常不错的选择。协变量是对观察结果有影响但无法或难以控制的因素。协方差分析是通过直线回归的方式把协变量值化为相等协变量取值其总均数后求得因变量的修正均数以此控制混杂因素的影响后用方差分析比较修正均值间的差别。适用条件1协变量为连续变量且各组因变量与协变量呈线性关系2各组因变量残差呈正态分布3各组因变量残差等方差4各组因变量和协变量的回归线平行即斜率相等。也就是要求对于不同的自变量协变量对因变量的影响相同。如不满足平行线假定说明自变量和协变量存在交互作用他们会同时对因变量产生影响这样混杂起来我们就无法控制协变量。5在考察因变量与协变量的线性关系时严格来讲也需要考察建立每条回归直线的前提线性趋势、独立、正态、方差齐、不存在多重共线、无明显异常点等具体可参考“多因素线性回归”。示例“两独立样本的t检验”数据来自excel的自动生成没有任何实际意义。严格来说本例因变量与协变量的线性关系也不明显并不适合使用协方差分析。本例为演示操作步骤和结果解读使用。示例1 SPSS操作步骤与结果解读【1】条件考察1因变量与协变量的线性关系考察GraphsChartBuilder…结果显示不论Labe组还是Meto组舒张压的基线值与治疗后结果线性关系并不明显不适合使用线性模型来统计推断。注本示例数据是通过Excel自动生成没有任何实际意义。实际上使用线性模型进行拟合的结果也显示两组的基线值与治疗后的舒张压并不成线性关系线性拟合步骤如下AnalyzeRegressionLinear…Dependent因变量Dw13Independent自变量Dbl变量筛选方法MethodEnterSelectionVariables筛选变量通过Rule筛选Group1和Grou2分别进行两次线性拟合主要结果Group1模型F0.250P0.620Dbl系数估计值-0.109t-0.500P0.620。Group2模型F0.190P0.666Dbl系数估计值0.081t0.435P0.666。两个模型均只有一个自变量系数检验和模型检验是一致的。线性关系不成立是不能直接进行协方差分析的。为更好的演示操作本例继续协方差进行分析的后续步骤。2平行线假定检验要检验治疗前和治疗后的舒张压的回归线是否平行即治疗前舒张压对治疗后舒张压的影响在labe和meto两个组中是否相同可用治疗前舒张压Dbl与治疗方法Group是否存在交互作用来表示。AnalyzeGeneralLinear ModelUnivariate…因变量Dw13固定因素Group协变量DblModel…对话框选择“Build Term”构建含有“Group、Dbl、Group*Dbl”的模型其他默认选项注Model…对话框全因素模型可以考察所有因素及其之间的交互作用但各因素与协变量的交互作用不会输出需要强行纳入处理因素和协变量的交互作用以进行分析即group处于不同水平时Dw13随Dbl变化的斜率是否相等。结果显示Group与Dbl的交互项无统计学意义F0.442P0.508可以认为两组的斜率相同。3残差正态性与方差齐性考察生成残差AnalyzeGeneral Linear ModelUnivariate…因变量Dw13固定因素Group协变量Dbl。Save…对话框PredictedValuesUnstandardizedResidualsUnstandardized、Srandardized。正态性与方差齐性考察AnalyzeDescriptive Statistics Explore…因变量列表选入新生成的变量“Residual for Dw13[RES_1]”因素列表选入“Group”Plots…对话框选中Normality plots with tests、Spread vs Levelwith Levene Test中的Untransform。方差齐性检验也可以直接在“选项”对话框中选择“Homogeneity tests”。结果显示Labe组数据呈正态Meto组数据正态性一般结合QQ图可以认为近似正态。可以认为两组方差相等。正态性和方差齐性的检验方法很多具体可参考正态分布与方差齐性的检验方法与SPSS操作若要求不严格可以直接用原始数据代替残差进行检验。4因变量与协变量的线性回归条件检验本例略可参考“多因素线性回归”。【2】协方差分析AnalyzeGeneralLinear ModelUnivariate…因变量Dw13固定因素Group协变量Dbl。Model模型…选择“Build Term”构建含有“Group、Dbl”的模型。或者直接选择默认的全因素Full factorial模型。在适用条件的分析中已经得出两组斜率相同Group和Dbl的交互项无统计学意义因此Group*Dbl应从模型中剔除。EMMeans边际均数…显示边际均值框选入Group。选中“比较主效应”用于所选因素不同水平的主效应的边际均值两两比较默认LSD法本例只有两组跟组间整体比较是一致的。“边际均数”的各个选项在旧版本中存在于“选项”对话框中。边际均数是剔除了其他变量的影响用于各水平比较的估计值当分析模型含有协变量边际均值和原始均值并不对应。Save保存…去掉在平行性检验中选中的变量。Options选项…Display输出内容Descriptive statistics描述性统计量、Parameterestimates参数估计、Homogeneity tests方差齐性检验。其他默认选项。【3】结果与解读1受试者间因素信息2描述性统计量。两组舒张压在用药13周后绝对数值上有差异。3方差齐性检验可以认为两组残差方差齐同F0.013P0.9090.05。4受试者间效应检验。考虑了协变量之后的方差分析结果。舒张压的基线水平对治疗结束的舒张压没有影响F0.000P0.9850.05不同的用药方案治疗结束后舒张压不同F6.599P0.0120.05。5参数估计。给出模型方程的一些系数Dw1388.613-0.003Dbl0.977Group。注意SPSS默认以取值较高的水平Group2为对照。舒张压的基线水平对治疗结束的舒张压水平没有影响t-0.109P0.9850.05与Meto组相比Labe组治疗后血压值偏高0.977t2.569P0.0120.05。6.1修正均值估计。一般来说经过修正后组间差异会变小原数据均值可参见描述性统计量表的结果。另外表格还显示Dw13的修正均值是按基线Dbl100.2进行评估这个值实际上就是协变量的总均数。6.2修正均值成对比较。本例只有两组与6.3的整体比较结果一致。6.3修正均值的单因素方差分析。组间效应的方差分析结果同受试者间效应检验结果一致。不同的用药方案治疗结束后舒张压不同F6.599P0.0120.05。【4】多重线性回归也可以用于这种协变量的分析。AnalyzeRegressionLinear…Dependent因变量Dw13Independent自变量Dbl、Group变量筛选方法MethodEnter。主要结果与协方差分析的参数估计一致系数检验也与协方差分析的组间t检验结果完全一致不再累述。系数表中Group的系数为-0.977而协方差分析中为0.977是参照水平不同造成的。示例2 60名糖尿病患者随机分为3组分别给与常规药、新药A和新药B的降血糖治疗比较3组治疗的血糖值。这个案例第一考虑就是采用完全随机设计的方差分析可以直接使用One-Way ANOVA过程或者Univariate过程进行具体过程可参考方差分析。结果显示3组治疗后效果没有统计学差异F2.171P0.123。但同时我们也发现治疗前的血糖的基线值有统计学意义F4.457P0.0160.05,其中常规药和新药B存在统计学差异P0.004。我们很难说治疗后的效果没有统计学差异是因为不同的给药方法治疗效果一样还是因为基线值的差异造成的。可以考虑使用协方差分析剔除基线值对结果的影响。【1】条件考察。1线性趋势考察GraphsChart Builder…结果显示3组线性趋势较为明显。但从拟合线上看3条回归直线存在交叉可能不满足回归线平行的条件需要在统计学上进行检验。2平行线检验AnalyzeGeneral Linear ModelUnivariate…结果显示协变量与分组变量交互作用没有统计学意义F1.901P0.1590.05满足回归线平行的条件。3正态性、方差齐性考察。步骤略可参见示例1。各组数据残差呈正态分布方差齐同。【2】协方差分析AnalyzeGeneral Linear ModelUnivariate…主要结果1受试者间因素信息。2描述性统计量。三组血糖值在用药后平均值、标准差及案例数。3方差齐性检验三组残差方差齐同F1.682P0.1950.05。4受试者间效应检验。建立的分析模型有统计学意义F88.784,P0.001说明至少有一个因素分组变量或协变量对因变量有影响。基线值协变量值的确能对最终的结果产生影响F243.549P0.001,不同的用药方案治疗效果也不同F6.299P0.0030.001。5模型参数估计。基线值协变量值对最终结果的影响有统计学意义t15.606 P0.001,t值15.606协方差分析中F值243.549的平方治疗前血糖每升高1mmol/L治疗后血糖升高0.604mmol/L。与药物BGroup3相比常规药物Group1有治疗效果更差t2.216P0.0310.05将药物B改用常规药物进行治疗血糖升高0.665mmpl/L与药物BGroup3相比药物AGroup2有治疗效果更差t3.523P0.0010.05将药物B改用药物A进行治疗血糖升高1.001mmpl/L。6边际均数的估计值。因变量边际均数、标准误及95%置信区间治疗后血糖值End的修正均值是按基线Baseline13.298进行评估该值是协变量基线值的的总均数。7边际均数的成对比较。结果显示药物B治疗效果好于常规药物P0.031和药物AP0.001药物A和常规药物治疗效果没有统计学差异P0.244。边际均数是剔除了其他变量的影响用于各个水平比较的估计值当分析模型含有协变量边际均值和原始均值并不对应原始均值的Post Hoc比较可参见示例2开始处表格。8受试者间边际均数的总体比较。同受试者间效应检验结果一致F6.299P0.003不同的用药方案治疗效果也不同。【3】同样的该示例也可改用多因素线性回归可以得到与协方差分析相一致的结果但需要对无序多分类的分组变量Group进行哑变量设置以常规药物Group1为参考水平为例步骤如下1DrugA哑变量编码TransformRecodeinto Different Variables…重复以上操作或在DrugA哑变量设置基础上对Old and New Variable对话框中的赋值修改进行DrugB的哑变量编码。如果变量较多可以直接在完成第一个哑变量的编码后点击Paste按键进入程序编辑器复制黏贴修改赋值的方法进行全部哑变量的设置如本例可以复制第一行然后对赋值进行修改如下黑体为粘贴修改后的内容RECODE Group (21) (ELSE0) INTO DrugA.RECODE Group(31) (ELSE0) INTO DrugB.EXECUTE.然后点击运行即可。2多因素线性回归AnalyzeRegressionLinear…Dependent因变量EndIndependent自变量Baseline、DrugA、DrugB变量筛选方法MethodEnter。要特别注意哑变量要遵循同进同出的原则如进行变量筛选可以将哑变量放在一个Block中进行。3主要结果回归模型有统计学意义F88.784,P0.001,基线值协变量值的确能对最终的结果产生影响t15.606 P0.001, t值15.606协方差分析中F值243.549的平方治疗前血糖每升高1mmol/L治疗后血糖升高0.604mmol/L。与常规药物相比药物B具有更好的治疗效果t-2.216P0.0310.05将常规药物改用药物B进行治疗血糖可以降低0.665mmpl/L而药物A的治疗和常规药物的治疗效果类似t1.178P0.2440.05。注意示例编码是DrugA和DrugB是与常规药物相比如要比较药物A和药物B则需要对哑变量的赋值进行修改。此处有人可能会发现系数与协方差分析的参数估计系数估计值不一致这是因为SPSS默认以取值较高的水平Group3DrugB为对照如将常规药、药物A和药物B分别赋值为3、2、1并在数据表中对应的记录做修改后做协方差分析结果和采用哑变量的分析完全一致结果如下还有一个问题要考虑当协变量与因变量的回归线不平行及分析因素与协变量存在交互作用时该如何处理除了数据变换处理可以进行分段进行协方差分析或者在分析因素不同水平上分别进行分析。在多因素线性回归中我们可以考虑引入交互项但引入交互项和可能带来的问题是分析因素与交互项存在多重共线在多因素线性回归一文的最后我们采用的方法是将变量中心化。当然也可以不引入交互项而在分析因素不同水平上分别进行线性回归。最后本例拟合多因素线性回归将无序多分类的分组因素重新编码为哑变量对分类变量除了使用这种办法还可以使用分类变量的最优尺度回归来进行。END转自个人微信公众号【Memo_Cleon】的统计学习笔记协方差分析方差分析与线性回归的统一。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/927560.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!