一区思路!挑战5天一篇NHANES预测模型 DAY1-5

挑战5天一篇预测模型NHANES

Day1!

近期美国关闭seer数据库的信息在互联网上广泛传播,大家都在担心数据库挖掘是否还能做。这个问题其实是有答案的,数据库挖掘肯定能做,做没被关的数据库即可,同时留意一些国产数据库~

因此我在这个时间段挑战做一篇nhanes数据挖掘库挖掘,坚定大家的信念。只有拥有SCI,才有硕士选择更好的权利,才有读到博士的机会,一定坚定信念,数据库那么多,总有我们能做的~

为了提高挑战的难度和成稿文章的接收率,挑我决定挑战5天利用NHANES数据库完成一篇预测模型SCI!

第一天的主要任务就是熟悉数据库+明确选题+确定目标期刊和目标文献

由于我们之前发起过很多期NHANES的挑战,对NHANES的官网还是非常熟悉的,这里就大大缩短了熟悉网站的时间。

简单来说,NHANES数据库是一个 涉及心血管、内分泌、营养、感染、妇产等多个领域的,无需申请或伦理审批,数据完全免费的公共数据库。数据量特别的大,涉及的相关指标很多,可以适合各个不同的科室的朋友来挖掘写作~

之前的挑战大多研究的是A变量与B疾病之间的关联,这次想做点不一样的,利用同样的数据库来做临床预测模型~

我用“NHANES + nomogram”进行了初步的检索,发现发的文章数量不多,正是发文的好时机!

我想建立一个我的目标疾病的人群全因死亡率的列线图,所以又去检索了“NHANES and nomogram and 目标疾病”,目前还没有人发过,那就这么定啦!接着在pubmed上根据我的目的选择了一个目标杂志,目标期刊:Front Pharmacol 标题Development and validation of a nomogram for predicting all-cause mortality in American adult hypertensive populations,随后去深入了解了这个杂志,不是水刊,发文量和被引数都还可以,那就他啦

坚定信念,让我们一起冲冲冲!!!

Day 2!

虽然最近医院很忙,但挑战不能停~

第2天主要任务:提取数据前的准备

具体需要干的就是:

  1. 阅读5-10篇NHANES预测模型的文章
  2. 根据文章确定自己需要的变量
  3. 整理变量的具体信息
  4. 整理需要的数据

公开数据库有很多,如MIMIC、eICU数据库等,但是相较而言NHANES数据库的数据获取比较简单,而且我们已经将所有的数据都下载到了本地,大大缩短了我们提取数据的时间,对我们这些“临床打工人”来说是非常友好的!

今天最主要的一步就是整理变量的信息,在动手前,我一般会花几十分钟时间,整体浏览一下这个数据库,对于什么样的数据在demo里,什么样的数据是在问卷里做到心中有数,有些实在找不到的变量,也可以去试试首页上的search variables。

变量信息整理好后,其实就完成了大半,接下来要做的就是把需要的xpt文件整理好就好啦~我们前期花了一些时间,把所有的周期的所有数据全部下载到本地啦,所以整理数据几分钟就能完成~

好啦,今天的分享就到这里啦!

Day 3!

Day3任务:数据提取与清洗。

前期我已经把所有的数据都下载好啦,现在主要的目标就是进行数据的提取清洗,我们用R将所需要的数据提取出来。在第二天我们已经把所需要的数据的具体信息都整理好啦,这个表格对我们的数据提取至关重要~

因为我做的是目标疾病的死亡率的预测模型,所以要考虑的主要有三个方面:

  1. 目标疾病
  2. 死亡的信息
  3. 需要考虑的变量

因为之前以及熟悉过这个代码啦,所以提数据的时候很easy~用代码提啊提,很快就搞完了。需要花一点时间的地方就是数据的清洗,做预测模型和普通的NHANES在数据清洗部是一样的,比如说高血压看起来只有是和否,但实际上需要依靠多个数据一起来定义:

  1. 目前正在口服降压药 2)血压大于140/90mmHg(取平均值) 3)被医生告知有高血压

工程还是很浩大滴!

但做多了也就熟练啦~猛猛一顿筛选就搞定!

整理好了数据以后,后面的分析实际上是非常简单的,选题才是最重要、最费时间的,也是最容易浮躁滴,静下来,方向对了,就一定能出成果。

一起加油呀~

Day 4!

Day4任务:跑出结果+完成中文稿

前期花了3天时间已经将数据都整理好啦,现在的任务就是跑出图片和表格~

在第2天我们已经大量阅读了相关的文献啦,模仿文献一步一步来就好了,常规NHANES预测模型的文章需要下面这些Table和Figure,我进行了提取和总结

Figure 1:流程图---数据来源过程及分析步骤

Table 1:基线特征---训练集和验证集的基线特征

Table 2:回归分析---单变量和多变量回归分析

Figure 2:LASSO 回归--选择风险因素

Figure 3:Nomogram--列线图的构建

Figure 4-6:预测模型的验证--ROC曲线、校准曲线、DCA曲线

这就是NHANES预测模型文章的主要结果啦,跑完数据后,我又根据我们的写作法把初稿整完啦,今天又是熬夜肝文章的一天~

因为前期已经整理好了数据,后面的分析实际上是非常简单的,选题和整理数据才是最费时间的,静下来,一步步踏实完成。

今日份挑战成功~

Day 5!

Day5任务:完成文章写作+投稿

昨天已经将图片、表格和初稿都已经整完啦,后面就是翻译润色和投稿哩!写作其实是最简单的哈哈哈~有我们的《框架写作法》理清思路,我昨天在跑完结果后才能快速写完初稿哈哈哈~

今天的任务比较轻松,只需要补充模块化写作部分,然后翻译润色,根据目标期刊改格式就好啦!改完以后再发给导师看一眼就可以准备投稿咯~~

挑战5天完成一篇NHANES预测模型,挑战成功!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/79173.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

centos7安装NVIDIA显卡

装备工作 我的系统版本 cat /etc/centos-releaseCentOS Linux release 7.9.2009 (Core) 内核版本 rpm -q kernel或者 rpm -qa|grep kernelkernel-3.10.0-1160.el7.x86_64 注意以上输出内核版本,按照我下面的操作步骤,不会出问题。否则重装系统都有可…

Web应用开发指南

一、引言 随着互联网的迅猛发展,Web应用已深度融入日常生活的各个方面。为满足用户对性能、交互与可维护性的日益增长的需求,开发者需要一整套高效、系统化的解决方案。在此背景下,前端框架应运而生。不同于仅提供UI组件的工具库&#xff0c…

Java @Transactional事物隔离级别和默认值详解

在 Java 开发中,Transactional 注解是 Spring 框架中用于管理事务的重要工具。它提供了多种配置选项,其中事务隔离级别是一个关键属性。本文将深入探讨 Transactional 注解的隔离级别默认值,并通过具体代码示例帮助你更好地理解和应用事务隔离…

车辆检测新突破:VFM-Det 如何用大模型提升识别精度

目录 ​编辑 一、摘要 二、引言 三、相关工作 四、Coovally AI模型训练与应用平台 五、方法 概述 综述:基于区域建议的检测 基于VehicleMAE的感知器 六、实验分析 数据集与评估指标 实现细节 属性预测模块预训练 与SOTA检测器的对比实验 消融实验 V…

微格式:为Web内容赋予语义的力量

一、什么是微格式? 微格式是一种建立在已有 Web 标准基础上的简单、开放的数据格式。它的核心思想是通过在 HTML 标签中添加特定的属性和类名,为网页内容添加语义注解,从而兼顾 HTML 文档的人机可读性。 简单来说,微格式就是一套约定俗成的 HTML 标记方式,让我们能够在不…

偏移成像中,原始地震采集数据的数据规则化(Data Regularization)

在油气地震资料处理中,柯希霍夫(Kirchhoff)积分法偏移成像对数据采集分布的均匀性较为敏感。当原始地震道数据存在空间分布不均匀时,会导致偏移噪声、假频或成像失真。数据规则化(Data Regularization)通过…

米壳AI:跨境电商图片翻译的“隐形革命”:当AI技术遇上全球化生意

一、行业观察:跨境卖家的“语言围城” 在亚马逊西班牙站,某家居品牌因产品图西班牙语翻译错误导致整批货物滞留港口;TikTok东南亚直播间里,美妆主播因马来语字幕错位引发消费者投诉……这些真实案例折射出跨境电商的集体困境&…

人工智能:如何将数据输入到神经网络中

文章目录 引言数据输入神经网络的重要性及示例以识别美女图片为例讲解数据输入不同应用的数据输入方式结语 人工智能是引领未来的前沿技术领域。通过这个系统性学习计划,我们将逐步深入如何将数据输入到神经网络中。无论你是初学者还是有一定基础的开发者&#xff0…

数据库12(游标)

游标语法 declare c1 cursor for select title from titles --定义一个游标c1,确定游标对应的列是titles表的title列,游标可以对应多个列 declare bname varchar(50) --声明变量 open c1 --初始化,开始使用游标 fetch next from c1 in…

第四部分:赋予网页健壮的灵魂 —— TypeScript(中)

目录 4 类与面向对象:构建复杂的组件4.1 类的定义与成员4.2 继承 (Inheritance)4.3 接口实现 (Implements)4.4 抽象类 (Abstract Class)4.5 静态成员 (Static Members) 5 更高级的类型:让类型系统更灵活5.1 联合类型 (|)5.2 交叉类型 (&)5.3 字面量类…

Vue3源码学习-提交限制

文章目录 前言✅ 1. ESLint 限制🔧 配置位置:✅ 启用了哪些规则(核心):📦 使用的插件和标准: ✅ 2. TSC 编译限制关键选项: ✅ 3. Git Hook 校验工具链配置例子(package.…

Arthas 使用攻略

目录 背景 Arthas是什么? 安装 使用arthas-boot(推荐) 启动 常用命令 一键生成arthas命令的插件(强烈推荐) watch 一、命令语法结构 二、核心参数详解 三、实战场景 1. 基础观测 - 查看入参和返回值 2. 条件过滤 - 只关注特定参…

冥想类短视频批量剪辑自动混剪技术实践:从素材处理到智能合成全解析

一、引言:工业化内容生产的技术突围 在心理健康类内容爆发的当下,冥想类短视频凭借「低制作成本 高用户粘性」的特性成为热门赛道。本文结合实战经验,解析如何通过模块化素材处理、参数化合成引擎、自动化质量控制等技术手段,构…

【自定义控件实现最大高度和最大宽度实现】

背景 开发中偶尔遇到控件宽度或者高度在自适应的情况下,有个边界值,也就是最大值。 比如高度自适应的情况下最大高度300dp这种场景。 实现 关键节点代码: Overrideprotected void onMeasure(int widthMeasureSpec, int heightMeasureSpec)…

综合练习三

使用到的知识点:xml文件,初始化file数据,提取file文件数据 题目:水文检测系统 备注:可以把序号作为该条数据的唯一标识(即UUID),而不是第一条第二条数据这样的类型。代码是后者&…

Microsoft Entra ID 详解:现代身份与访问管理的核心

Microsoft Entra ID(原名为 Azure Active Directory,简称 Azure AD)是微软推出的云端身份和访问管理服务,专为现代混合环境设计,支持企业安全地管理用户身份、控制资源访问,并集成多种应用与服务。以下从核心功能到最佳实践全面解析 Entra ID。 1. Entra ID 的核心定位 …

从技术角度看Facebook的隐私保护机制

在数字化时代,隐私保护成为了公众关注的焦点。作为全球最大的社交网络平台之一,Facebook 在隐私保护方面采取了一系列技术措施。本文将从技术角度探讨 Facebook 的隐私保护机制,揭示它是如何在提供个性化服务的同时,确保用户隐私信…

基于策略模式实现灵活可扩展的短信服务架构

基于策略模式实现灵活可扩展的短信服务架构 引言 在企业级应用开发中,短信服务是不可或缺的基础功能之一。随着业务发展,我们可能需要接入多个短信服务提供商(如阿里云、腾讯云、第三方短信网关等),并能够在不修改核…

Vue 3 单文件组件中 VCA 语法糖及核心特性详解

在 Vue.js 的开发世界里,单文件组件(Single File Components,简称 SFC)是构建复杂应用的基石。它将 HTML、CSS 和 JavaScript 代码封装在一个.vue文件中,极大地提高了代码的可维护性和复用性。 本文将深入探讨单文件组…

【Unity C#从零到精通】项目深化:构建核心游戏循环、UI与动态敌人系统

Langchain系列文章目录 01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…