第100+40步 ChatGPT学习:R语言实现多轮建模

回顾一下什么叫多轮建模:

要综合判断一个模型好不好,一次随机抽样是不行的,得多次抽样建模,看看整体的性能如何才行(特别是对于这种小训练集)。

所以我的思路是,随机抽取训练集和验证集2000次(随你),然后构建2000个ML模型(譬如2000个朴素贝叶斯),得出2000批性能参数。那怎么实现呢,下面上R语言代码,以朴素贝叶斯为例:

library(caret)
library(e1071)
library(pROC)# 加载数据集
dataset <- read.csv("X disease code fs.csv")
cat("数据集加载成功。\n")
X <- dataset[, 2:14]
Y <- dataset[, 1]# 初始化结果数据框
results <- data.frame(Random_Seed = integer(),Sensitivity_Test = numeric(),Specificity_Test = numeric(),AUC_Test = numeric(),Sensitivity_Train = numeric(),Specificity_Train = numeric(),AUC_Train = numeric()
)
cat("结果数据框初始化完成。\n")# 遍历随机种子
for (n in 1:2000) {set.seed(n)cat("设置随机种子为", n, "\n")# 划分数据集trainIndex <- createDataPartition(Y, p = 0.7, list = FALSE)X_train <- X[trainIndex, ]X_test <- X[-trainIndex, ]y_train <- Y[trainIndex]y_test <- Y[-trainIndex]cat("数据集划分为训练集和测试集。\n")# 标准化特征preProcValues <- preProcess(X_train, method = c("center", "scale"))X_train <- predict(preProcValues, X_train)X_test <- predict(preProcValues, X_test)cat("特征标准化完成。\n")# 训练朴素贝叶斯模型model <- naiveBayes(X_train, y_train)cat("朴素贝叶斯模型训练完成。\n")# 进行预测y_pred <- predict(model, X_test)y_train_pred <- predict(model, X_train)cat("完成对训练集和测试集的预测。\n")# 计算混淆矩阵cm_test <- confusionMatrix(as.factor(y_pred), as.factor(y_test))cm_train <- confusionMatrix(as.factor(y_train_pred), as.factor(y_train))cat("混淆矩阵计算完成。\n")# 计算AUC分数auc_test <- auc(as.numeric(y_test), as.numeric(y_pred))auc_train <- auc(as.numeric(y_train), as.numeric(y_train_pred))cat("AUC分数计算完成:测试集 =", auc_test, ",训练集 =", auc_train, "\n")# 提取敏感性和特异性sen_test <- cm_test$byClass["Sensitivity"]sep_test <- cm_test$byClass["Specificity"]sen_train <- cm_train$byClass["Sensitivity"]sep_train <- cm_train$byClass["Specificity"]cat("敏感性和特异性提取完成。\n")# 追加结果results <- rbind(results, data.frame(Random_Seed = n,Sensitivity_Test = sen_test,Specificity_Test = sep_test,AUC_Test = auc_test,Sensitivity_Train = sen_train,Specificity_Train = sep_train,AUC_Train = auc_train))cat("第", n, "次迭代的结果已追加。\n")
}# 保存结果到CSV
write.csv(results, "jet_NB_par.csv", row.names = FALSE)
cat("结果已保存到jet_NB_par.csv。\n")

简单解说:

(A)其实就是一个for循环语句,for (n in 1:2000) ,2000次就是2000,你要是想运行10000次,就改成10000;

(B)运行以后呢,可以看到模型在迭代,显示的是运行到第几个模型了:

(C)用代码write.csv(results, "jet_NB_par.csv", row.names = FALSE)输出成excel查看,输出地址就是你的工作路径,不懂的话可以使用代码getwd()展示出来。

(D)打开工作路径,可以发现jet_NB_par这个文件:

(E)打开文件,调整一下格式:

(F)然后可以操作了,比如test-sen排个序,看看最好的有多好;比如看看2000次的平均值和标准差:AUC平均值0.77-0.78左右。剩下的自己玩了,不说那么多了,发挥你们的妄想空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/79921.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

编码器型与解码器型语言模型的比较

编码器型与解码器型语言模型的比较 1. 引言 自然语言处理&#xff08;NLP&#xff09;领域近年来取得了革命性进展&#xff0c;这在很大程度上归功于基于Transformer架构的语言模型。在这一技术生态中&#xff0c;编码器型&#xff08;Encoder-only&#xff09;和解码器型&am…

python--------修改桌面文件内容

目录 1. 文件的读写1. 写入文件2. 读取文件3. 追加内容到文件 2.file_path 的常见方法1. 绝对路径2. 相对路径3. 使用 os.path 模块构建路径5. 路径操作5. 用户主目录路径 4. 修改文件内容1.将修改后的内容写回文件2. 逐行处理文件内容3. 使用上下文管理器确保文件安全 1. 文件…

爱普生VG7050EFN压控晶振在小基站的应用优势

在 5G 通信时代&#xff0c;小基站作为提升网络覆盖和容量的重要一环&#xff0c;小基站的稳定运行对于保障用户流畅的通信体验起着关键作用。而在小基站的核心组件中&#xff0c;时钟信号源的质量直接影响着通信质量和设备性能。爱普生VG7050EFN晶振凭借其高性能、小尺寸和低功…

人工智能如何革新数据可视化领域?探索未来趋势

在当今数字化时代&#xff0c;数据如同汹涌浪潮般不断涌现。据国际数据公司&#xff08;IDC&#xff09;预测&#xff0c;全球每年产生的数据量将从 2018 年的 33ZB 增长到 2025 年的 175ZB。面对如此海量的数据&#xff0c;如何有效理解和利用这些数据成为了关键问题。数据可视…

精益数据分析(42/126):移动应用商业模式的深度剖析与实战要点

精益数据分析&#xff08;42/126&#xff09;&#xff1a;移动应用商业模式的深度剖析与实战要点 在创业和数据分析的学习之路上&#xff0c;我们持续探索不同商业模式的奥秘&#xff0c;今天聚焦于移动应用商业模式。我希望和大家一起进步&#xff0c;深入解读《精益数据分析…

未来 CSS:变量、容器查询与新特性的探索

引言&#xff1a;CSS 演进与未来展望 在前端开发的快速发展浪潮中&#xff0c;CSS 已从简单的样式标记语言蜕变为构建现代设计系统的强大基础。根据 HTTP Archive 的 Web Almanac 的调查&#xff0c;超过 86% 的网站已采用至少一项现代 CSS 特性&#xff0c;这一数字仍在持续攀…

概统期末复习--速成

随机事件及其概率 加法公式 推三个的时候ABC&#xff0c;夹逼准则 减法准则 除法公式 相互独立定义 两种分析 两个解法 古典概型求概率&#xff08;排列组合&#xff09; 分步相乘、分类相加 全概率公式和贝叶斯公式 两阶段问题 第一个小概率*A在小概率的概率。。。累计 …

论微服务架构设计及应用

目录 摘要(300~330字) 正文(2000~2500字,2200字为宜) 背景介绍(500字做左右) 论点论据(1500字做左右)

【东枫科技】AMD / Xilinx Alveo™ V80计算加速器卡

AMD / Xilinx Alveo™ V80计算加速器卡 AMD/Xilinx Alveo ™ V80计算加速器卡是一款功能强大的计算加速器&#xff0c;基于7nm Versal™ 自适应SoC架构而打造。 AMD/Xilinx Alveo V80卡设计用于内存密集型任务。 这些任务包括HPC、数据分析、网络安全、传感器处理、计算存储和…

基于大模型的自然临产阴道分娩全流程预测与方案研究报告

目录 一、引言 1.1 研究背景与目的 1.2 研究意义 1.3 国内外研究现状 二、大模型技术原理与应用概述 2.1 大模型基本原理 2.2 在医疗领域的应用现状 2.3 用于分娩预测的优势 三、术前预测与准备方案 3.1 产妇身体状况评估指标 3.2 大模型预测流程与方法 3.3 基于预…

macbook install chromedriver

# 打开 Chrome 访问以下地址查看版本 chrome://version/# 终端查看版本号 (示例输出: 125.0.6422.113) /Applications/Google\ Chrome.app/Contents/MacOS/Google\ Chrome --version测试&#xff1a;

LeetCode 790 多米诺和托米诺平铺 题解

对于本题不去看LeetCode的评论区和题解很难想到如何去dp&#xff0c;毕竟就算再怎么枚举也很难找到适用于面向结果的规律。所以对于题解我建议大家还是去看一下灵神给的题解&#xff0c;以下是灵神汇总的图&#xff0c;如果能看懂的话&#xff0c;对于解决题目有很大的帮助。 根…

Day17 聚类算法(K-Means、DBSCAN、层次聚类)

一、聚类算法 1. K-Means 聚类 原理&#xff1a;K-Means 是一种基于划分的聚类算法&#xff0c;目标是将 n n n 个样本划分到 k k k 个簇中&#xff0c;使得簇内样本的相似度尽可能高&#xff0c;簇间样本的相似度尽可能低。算法通过迭代的方式&#xff0c;不断更新簇的质心…

【编程干货】本地用 Ollama + LLaMA 3 实现 Model Context Protocol(MCP)对话服务

模型上下文协议&#xff08;MCP&#xff09;本身提供的是一套标准化的通信规则和接口&#xff0c;简化了客户端应用的开发。 MCP 实际上是一套规范&#xff0c;官方把整套协议分成「传输层 协议层 功能层」三大块&#xff0c;并对初始化握手、能力协商、数据/工具暴露、安全…

永磁同步电机控制算法-基于新型趋近律的反馈线性化滑模控制

一、原理介绍 针对永磁同步电机传统PID矢量控制方式无法实现d、q轴电流完全解耦控制的问题&#xff0c;运用反馈线性化理论实现永磁同步电机转速和d轴电流解耦。针对反馈线性化导致的鲁棒性下降问题&#xff0c;利用滑模控制方式提高系统鲁棒性&#xff0c;引入新型双幂次趋近…

德尔菲法和层次分析法是什么

德尔菲法和层次分析法是什么 德尔菲法和层次分析法是两种常用的决策分析方法 德尔菲法 定义:德尔菲法是一种采用背对背的通信方式征询专家小组成员的预测意见,经过几轮征询,使专家小组的预测意见趋于集中,最后做出符合市场未来发展趋势的预测结论。实施步骤 组成专家小组…

【windows】win10部分版本的sxs文件下载

Win10部分版本的sxs文件下载 win10 1703 链接: https://pan.baidu.com/s/13O5djVSWIhIjBP1ZVtORAA?pwdsdpp 提取码: sdpp win10 1809 链接: https://pan.baidu.com/s/1vUEMQWqWcyTicHLJNox99w?pwddfx4 提取码: dfx4 win10 1903,1909 链接: https://pan.baidu.com/s/1MoKcm3N…

Java项目部署-Springboot+Vue网页部署上线全教程

SpringbootVue网页部署上线全教程 文章目录 SpringbootVue网页部署上线全教程1.环境说明2.Mysql安装部署2.1 安装并修改密码2.2 防火墙开放 3.Spring Boot项目打包3.1 配置公网ip3.2 安装 Maven3.3 使用 Maven 打包 Spring Boot 项目3.4 Centos运行Jar包3.4.1 安装 Java 1.8 环…

FISCO BCOS【初体验笔记】

飞梭区块链搭建初体验笔记 环境部署创建四个节点的飞梭区块链用的VMware17 centos 7.9 区块链是飞梭2.0用的webase-frontJava环境的正确安装Webase-front搭建 智能合约设计一点合约调试笔记 智能合约abi文件转为go文件后端项目配置相关工具linux常用命令&#xff08;防忘记&…

内容社区系统开发文档

1 系统分析 1.1 项目背景 1.2 需求分析 2 系统设计 2.1 系统功能设计 2.2 数据库设计 2.2.1 数据库需求分析 2.2.2 数据库概念结构设计 2.2.3 数据库逻辑结构设计 2.2.4 数据库物理结构设计 2.2.5 数据库视图设计 2.2.6 函数设计 2.2.7 存储过程设计 2.2.8 触发器…