2区组的2水平析因实验的混区设计

本文是实验设计与分析(第6版,Montgomery著傅珏生译)第7章2k析因的区组化和混区设计第7.4节的python解决方案。本文尽量避免重复书中的理论,着于提供python解决方案,并与原书的运算结果进行对比。您可以从Detail 下载实验设计与分析(第6版,Montgomery著傅珏生译)电子版。本文假定您已具备python基础,如果您还没有python的基础,可以从Detail 下载相关资料进行学习。

许多问题中,在一个区组中进行一析因设计的完全重复是不可能的。混区设计(confounding)是一种设计方法,它将一个完全的析因设计安排在多个区组之内,区组的大小比一次重复中的处理组合的个数要小。这一方法使得关于特定处理效应(通常是高阶的交互作用)的信息与来自区组的信息不可区分或者说混杂。本章集中讨论2k析因设计的混区设计。即使是由于每一区组不包含所有的处理或处理组合而出现不完全区组设计,但是对于2k析因系统的特殊结构,也将有简化的分析方法。

我们考虑有2p个不完全区组的2k析因设计的结构和分析方法,其中p<k。因此,这些设计将实在两个区组内(p=1),4个区组内(p=2)、8个区组内(p=3),等等。

假定要实施一个单次重复的22设计。比如说,22=4个处理组合的每一个需用一定量的原材料,而每批原材料只够供给两个处理组合去试验。这样一来,就需要两批原材料。如果把原材料的批次看作区组,则我们必须把这4种处理组合中的两种分派给每个区组。

图7.1表示对此问题的一种可能设计。图7.1(b)是几何观点,表示把相反对角线上的处理组合分派给不同的区组。图7.1(b)中,区组1包含处理组合(1)和ab。区组2包含a和b。当然,在同一区组内的个处理组合的实施顺序是随机确定的。先实施哪一区组的试验也是随机决定的。假定没有划分区组而来估计A和B的主效应。由(6.1)式和6.2)式得

因为每一估计量都有来自每个区组的一个加号的处理组合和一个减号的处理组合,所以A和B都不受划分区组的影响.也就是说,区组1和区组2之间的差异抵消了。

今考忠AB的交互作用

因为两个带加号的处理组合[ab和(1)]都在区组1,两个带减号的处理组合(a和b)都在区组2,所以区组数应和AB的交互作用是一致的,也就是说,AB与区组混杂了。

这一点可以从22设计的加减符号表中容易看出。此表原先在表6.2中给出,为方便起见,重列于表7.3。由此表可见,AB上带加号的处理组合都安排在区组1,而AB上带减号的处理组合都安排在区组2。这种方式可用来把任一效应(A,B,AB)与区组相混。例如,如果(1)和b安排到区组1,a和ab安排到区组2,则主效应A与区组相混。通常的实践是把高阶交互作用与区组相混。

这个方案可用来混杂任意二区组中的2k设计。作为第二个例子,考虑二区组的23设计。设我们想把三因子交互作用ABC与区组相混。由表7.4的加减符号表,我们把ABC中带碱号的处理组合分在区组1,ABC中带加号的处理组合分在区组2。所得的设计如图7.2所示。我们再次强调,在一区组内的处理组合的试验顺序是随机的

  1. 构造区组的其他方法

2.误差的估计

当变量的个数较小时,比方说k=2或3,通常必须进行重复以求得误差的估计量。例如,假定需要进行有两个区组的ABC被混杂的23析因实验,实验者决定进行4次里复。设计如图7.3所示。在每次重复中ABC都被混杂。

此设计的方差分析见表7.5,有32个观测值和31个总的自由度。又因为有8个区组,所以和这些区组有关的必须是7个自由度。7个自由度的一种分解如表7.5所示。误差平方和实际上由重复和每个效应(A,B,C,AB,AC,BC)之间的二因子交互作用所组成。将交互作用看作为零,并把它们的均方值看作为误差的估计量通常是不会有问题的。主效应和二因子交互作用都是相对均方误差进行检验的。Cochran and Cox(1957)指出,区组或ABC均方可以和由ABC提供的均方误差进行比较,它实际上是由重复×区组提供的。这一检验法通常是很不灵敏的。

如果资源充足,允许混区设计做重复,则一般说来,在每次重复时采用稍有不同的设计区组方法会较好一些。这一处理方法是在各次重复中泡杂不同的效应,以便求得关于所有效应的一些信息。这样的方法称为部分混区设计,7.7节会给予讨论。如果k适当大,比方说k≥4,则经常只数一次重复就行了,实验者通常假定高阶交互作用可被忽略并将它们的平方和组合起来作为误差。因子效应的正态概率图对这一点十分有帮助。

例7,2考忠例6.2描述的情况。回想4个因子:温度(A),压强(B)、甲醛的浓度(G)和境排速度(D)。在试验性工厂中研究这些因子:以确定影响产品渗透率的效应。我们用这个实验来说明在一个无重复设计中区组化和混杂的思想。我们对最初的实验作了两处修改。首先,假定一批原材料不能进行全部24=16个处理组合的试验。一批原材料只能进行8个处理组合的试验,所以,采用二区组的2混区设计看来是恰当的。将高阶交互作用ABCD与区组混杂也是很自然的,定义对照是

L=x1十x2+x3+x4

容易证明,此设计如图7.4所示。另外,可以检在表6.12。观测被安排到区组1的ABCD列中的标为“+”的处理组合,以及区组2的ABCD列中的标为“一”的处理组合。

我们作的第二处修改是引入区组效应,以说明区组的作用。假定我们选择两批原材料来进行实验,其中之一质量较差,因此,用这批材料得到的平均啊应低于那些用好的质量的材料20个单位。质量差的批次为区组L,质量好的批次为区组2(哪个批次为区组1,哪个批次为区组2无关紧要)。先做区组1的试验(当然,区组里的8个试验是按随机次序进行的),但是,响应低于那些用好的质量材料的20个单位,图7.4b显示了响应的结果--注意到它们是可以由例6.2给出的原始观测减去区组效应得到的。即,处理组合(1)的原始响应为45,图7.4b中报告为(1)=25(=45-20)。该区组的其地响应也可以类似得到。做完区组1的试验后,接着做区组2的8个试验,这个批次的原材料没有问题,所以,响应和它们最初在例6.2中的非常一致。

表7.6所列的是例6.2的“修改”观点的效应估计。注意到4个主效应,6个二因子交互作用、4个三因子交互作用的估计和没有区组效应的例6.2得到的效应估计一样。计算效应估计的通常比例后,可以看出因子A,C,D和AC交互作用以及AD交互作用是重要效应,与原始实验一样。(读者应当确认这一点)

import numpy as np

import matplotlib.pyplot as plt

import statsmodels.formula.api as smf

import pandas as pd

import statsmodels.api as sm

from sklearn import linear_model

import seaborn as sns

import matplotlib.pyplot as plt

import mistat

from scipy import special

from scipy.stats import ncx2

x5 = [1,1,1,1,1,1,1,1,-1,-1,-1,-1,-1,-1,-1,-1]

x1 = [-1,-1,-1,-1,1,1,1,1, -1,-1,-1,-1,1,1,1,1]

x2 = [-1,-1,1,1,-1,-1,1,1,-1,-1,1,1,-1,-1,1,1]

x3 = [-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1,-1,1]

x4 = [1,-1,-1,1,-1,1,1,-1,-1,1,1,-1,1,-1,-1,1]

y1 = [43,68,48,70,71,86,104,65,25,55,25,60,80,40,45,76]

data = {"y1":y1,"x1":x1,"x2":x2,"x3":x3,"x4":x4,"x5":x5}

data=pd.DataFrame(data)

model1 = smf.ols(formula='data.y1 ~ C(data.x5)+data.x1+data.x2+data.x3+data.x4+data.x1*data.x2+data.x1*data.x3+data.x1*data.x4+data.x2*data.x3+data.x2*data.x4+data.x3*data.x4+data.x1*data.x2*data.x3+data.x1*data.x2*data.x4+data.x1*data.x3*data.x4+data.x2*data.x3*data.x4', data=data).fit()

print(model1.summary2())

                 Results: Ordinary least squares

====================================================================

Model:                OLS              Adj. R-squared:     nan

Dependent Variable:   data.y1          AIC:                -920.6635

Date:                 2024-04-25 10:16 BIC:                -908.3021

No. Observations:     16               Log-Likelihood:     476.33

Df Model:             15               F-statistic:        nan

Df Residuals:         0                Prob (F-statistic): nan

R-squared:            1.000            Scale:              inf

--------------------------------------------------------------------

                         Coef.  Std.Err.    t    P>|t| [0.025 0.975]

--------------------------------------------------------------------

Intercept               50.7500      inf  0.0000   nan    nan    nan

C(data.x5)[T.1]         18.6250      inf  0.0000   nan    nan    nan

data.x1                 10.8125      inf  0.0000   nan    nan    nan

data.x2                  1.5625      inf  0.0000   nan    nan    nan

data.x3                  4.9375      inf  0.0000   nan    nan    nan

data.x4                  7.3125      inf  0.0000   nan    nan    nan

data.x1:data.x2          0.0625      inf  0.0000   nan    nan    nan

data.x1:data.x3         -9.0625      inf -0.0000   nan    nan    nan

data.x1:data.x4          8.3125      inf  0.0000   nan    nan    nan

data.x2:data.x3          1.1875      inf  0.0000   nan    nan    nan

data.x2:data.x4         -0.1875      inf -0.0000   nan    nan    nan

data.x3:data.x4         -0.5625      inf -0.0000   nan    nan    nan

data.x1:data.x2:data.x3  0.9375      inf  0.0000   nan    nan    nan

data.x1:data.x2:data.x4  2.0625      inf  0.0000   nan    nan    nan

data.x1:data.x3:data.x4 -0.8125      inf -0.0000   nan    nan    nan

data.x2:data.x3:data.x4 -1.3125      inf -0.0000   nan    nan    nan

--------------------------------------------------------------------

Omnibus:                4.847         Durbin-Watson:           1.389

Prob(Omnibus):          0.089         Jarque-Bera (JB):        2.523

Skew:                   -0.927        Prob(JB):                0.283

Kurtosis:               3.589         Condition No.:           3

====================================================================

Notes:

[1] Standard Errors assume that the covariance matrix of the errors

is correctly specified.

anova_table = sm.stats.anova_lm(model1, typ=2)

anova_table

model1 = smf.ols(formula='data.y1 ~ C(data.x5)+data.x1*data.x2*data.x3*data.x4', data=data).fit()

ABCD的交互效应是怎样的用?原始实验(例6.2)中该效应估计为ABCD=1.375。而在目前的例子中,ABCD交互效应的估计为ABCD=-18.625。因为ABCD与区组混杂了,用原始交互五效应(1.375)加上区组效应(-20)估计ABCD交互作用。所以ABCD=1.375+(-20)=-18.625。(你是否明白,为什么区组效应为-20?)区组效应可以用两区组平均响应间的差直接计算。即

当然,这个效应确实估计了区组十ABCD

表7.7描述了该实验的方差分析表。模型中包含了大的估计的效应。区组平方和为

该实验的结论十分符合没有区组效应的例6.2的结论。如果没有在区组中进行实验,且如果大小为-20的效应影响了前面的8个试验(它们可能按照随机方式进行的,因为16个试验在区组设计中是按照随机次序进行的),结果可能就不同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/83852.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

反向传播算法——矩阵形式递推公式——ReLU传递函数

总结反向传播算法。 来源于https://udlbook.github.io/udlbook/&#xff0c;我不明白初始不从 x 0 \boldsymbol{x}_0 x0​开始&#xff0c;而是从 z 0 \boldsymbol{z}_0 z0​开始&#xff0c;不知道怎么想的。 考虑一个深度神经网络 g [ x i , ϕ ] g[\boldsymbol{x}_i, \bold…

2025年PMP 学习二十三 16章 高级项目管理

2025年PMP 学习二十三 16章 高级项目管理 文章目录 2025年PMP 学习二十三 16章 高级项目管理高级项目管理战略管理战略管理的组成要素&#xff1a;企业战略转化为战略行动的阶段&#xff1a; 组织战略类型战略组织类型组织级项目管理OPM&#xff08;公司项目管理&#xff09; 组…

Journal of Real-Time Image Processing 投稿过程

投稿要求双栏12页以内(包括参考文献)&#xff0c;这个排版要求感觉不是很严格&#xff0c;我当时就是用普通的双栏的格式去拍的版&#xff0c;然后就提交了&#xff0c;也没单独去下载模版。 投稿过程 12.12 Submission received 12.12 Submission is under technical check 1…

t检验详解:原理、类型与应用指南

t检验详解&#xff1a;原理、类型与应用指南 t检验&#xff08;t-test&#xff09;是一种用于比较两组数据均值是否存在显著差异的统计方法&#xff0c;适用于数据近似正态分布且满足方差齐性的场景。以下从核心原理、检验类型、实施步骤到实际应用进行系统解析。 一、t检验的…

Web4X·AI实业未来家庭普及产品矩阵

Web4XAI实业未来家庭普及产品矩阵 > 打造一个“AI能干活、人更自由”的超级生活系统&#xff08;web4-web4.0&#xff09; 一、AI生活服务类 1、代表产品&#xff1a;  AI语音助手&#xff08;对话、提醒、天气、家庭调度&#xff09;  AI陪护机器人&#xff08;老…

Centos上搭建 OpenResty

一、OpenResty简介 OpenResty 是基于 Nginx 的扩展平台&#xff0c;完全兼容 Nginx 的核心功能&#xff08;如 HTTP 服务和反向代理&#xff09;&#xff0c;同时通过内嵌 LuaJIT 支持&#xff0c;允许开发者用 Lua 脚本灵活扩展业务逻辑。它简化了动态逻辑的实现。 二、安装…

项目管理进阶:基于IPD流程的项目管理部分问题及建议书【附全文阅读】

该文档主要探讨了研发项目管理中存在的问题及改进建议。指出项目组织、项目计划、项目监控等方面存在的问题&#xff0c;并给出了相应的设计要点。建议建立跨部门、全流程的项目计划体系&#xff0c;加强风险管理&#xff0c;引入科学的估计方法&#xff0c;建立项目历史数据积…

JVM之GC常见的垃圾回收器

收集器适用区域特点适用场景Serial新生代单线程&#xff0c;STW&#xff08;Stop-The-World&#xff09;客户端小应用Parallel Scavenge新生代多线程&#xff0c;吞吐量优先后台计算任务ParNew新生代Serial 的多线程版配合 CMS 使用CMS老年代并发标记&#xff0c;低延迟响应优先…

免费私有化部署! PawSQL社区版,超越EverSQL的企业级SQL优化工具面向个人开发者开放使用了

1. 概览 1.1 快速了解 PawSQL PawSQL是专注于数据库性能优化的企业级工具&#xff0c;解决方案覆盖SQL开发、测试、运维的整个流程&#xff0c;提供智能SQL审核、查询重写优化及自动化巡检功能&#xff0c;支持MySQL、PostgreSQL、Oracle、SQL Server等主流数据库及达梦、金仓…

HTTP/HTTPS与SOCKS5协议在隧道代理中的兼容性设计解析

目录 引言 一、协议特性深度对比 1.1 协议工作模型差异 1.2 隧道代理适配难点 二、兼容性架构设计 2.1 双协议接入层设计 2.2 统一隧道内核 三、关键技术实现 3.1 协议转换引擎 3.1.1 HTTP→SOCKS5转换 3.1.2 SOCKS5→HTTP转换 3.2 连接管理策略 3.2.1 智能连接池 …

3DGS——基础知识学习笔记

1.什么是3D高斯泼溅&#xff08;3D Gaussian Splatting&#xff09;&#xff1f; 目标&#xff1a;从一组稀疏的3D点&#xff08;比如通过相机或激光雷达采集的点云&#xff09;重建出高质量的3D场景&#xff0c;并支持实时渲染。 核心思想&#xff1a;用许多“3D高斯分布”&…

【C++】不推荐使用的std::allocator<void>

文章目录 不推荐使用的std::allocator<void>1. 核心区别2. 成员函数对比(1) allocate 和 deallocate(2) construct 和 destroy 3. 设计动机(1) std::allocator<T>(2) std::allocator<void> 4. 使用场景示例(1) std::allocator<int>(2) std::allocator&…

Go 语言云原生微服务全栈实战:Docker 镜像优化、K8s 编排与 Istio 流量治理

本系列文章将以 Go 语言为主导开发语言&#xff0c;系统性地讲解如何从零构建一个基于微服务架构的应用系统&#xff0c;涵盖以下核心模块&#xff1a; 使用 Go 构建高性能微服务构建精简且高效的 Docker 镜像利用 Kubernetes 进行微服务编排与部署通过 Istio 实现微服务的流量…

windows下authas调试tomcat

一般情况下&#xff0c;我们只需要输入以下代码 java -jar authas.jar调试tomcat时需要加上进程号 java -jar authas.jar <PID> 此外&#xff0c;如果你使用的是 Java 11 或更高版本&#xff0c;你需要添加 --add-opens 参数&#xff0c;以便 Arthas 能够访问 JVM 的内…

01_springboot中bean的生命周期

文章目录 bean的生命周期1. Bean定义阶段2. Bean实例化阶段3. 属性赋值阶段4. 初始化阶段5. 使用阶段6. 销毁阶段 bean的生命周期 在Spring Boot中&#xff0c;Bean的生命周期包括定义、实例化、属性赋值、初始化、使用和销毁等阶段。下面我将详细解释这些阶段&#xff0c;并提…

Oracle基础知识

目录 1.别名的使用 2.AND的优先级高于OR 3.where后面可以接别名&#xff0c;order by后面不可以 4.Oracle中SQL的执行顺序(重点) 5.dual万用表 6.是否区分大小写 7.Oracle常用数据类型 8.Oracle常用函数 (1)length字符、lengthb字节和cast强制类型转换 (2)数据类型转…

React 播客专栏 Vol.13|样式不难搞,Tailwind CSS 与 SVG 实战入门

&#x1f44b; 欢迎回到《前端达人 React 播客书单》第 13 期&#xff08;正文内容为学习笔记摘要&#xff0c;音频内容是详细的解读&#xff0c;方便你理解&#xff09;&#xff0c;请点击下方收听 视频版&#xff1a; 文字版&#xff1a; 今天我们进入样式化的实战环节&…

matlab慕课学习3.5

于20250520 3.5 用while 语句实现循环结构 3.5.1while语句 多用于循环次数不确定的情况&#xff0c;循环次数确定的时候用for更为方便。 3.5.2break语句和continue语句 break用来跳出循环体&#xff0c;结束整个循环。 continue用来结束本次循环&#xff0c;接着执行下一次…

鸿蒙开发进阶:深入解析ArkTS语言特性与开发范式

一、前言 在鸿蒙生态开发体系中&#xff0c;DevEco Studio作为核心开发工具为开发者提供了高效的集成环境。而在掌握工具使用之后&#xff0c;深入理解鸿蒙开发语言成为构建高质量应用的关键。本文将聚焦于鸿蒙系统的核心开发语言——ArkTS&#xff0c;全面解析其起源演进、声…

P2P最佳网络类型

跑P2P最佳的网络类型是什么&#xff1f;全锥型NAT1网络它属于最宽松的网络环境&#xff0c;IP和端口都没有限制&#xff0c;穿透率在95%以上&#xff0c;P2P连接成功率极高。使用全锥型网络的节点收益比其他受限网络类型高出3倍左右&#xff0c;能显著提升PCDN的跑量和收益。 其…