kaggle-ISIC 2024 - 使用 3D-TBP 检测皮肤癌-学习笔记

问题描述:
通过从 3D 全身照片 (TBP) 中裁剪出单个病变来识别经组织学确诊的皮肤癌病例
数据集描述:
图像+临床文本信息
评价指标:
pAUC,用于保证敏感性高于指定阈值下的AUC

主流方法分析(文本)
基于CatBoost、LGBM 和 XGBoost三者的组合,为每个算法创建了 XX个变体,总共XX个模型,进行集成学习。
CatBoost在传统梯度提升决策树(GBDT)基础上,引入了一系列关键技术创新,以提升处理类别型特征和缺失值的能力,以及整体模型性能,排序学习、目标导向的编码和缺失值处理。
LightGBM基于XGBoost基础上改进,基于Histogram(直方图)的决策树算法,单边梯度采样,互斥特征捆绑等
XGBoost,是基于预排序方法的决策树算法。这种构建决策树的算法基本思想是:首先,对所有特征都按照特征的数值进行预排序。其次,在遍历分割点的时候寻找一个特征上的最好分割点。最后,在找到一个特征的最好分割点后,将数据分裂成左右子节点。
参考超参数

lgbm_params = {'objective':        'binary','verbosity':        -1,'n_estimators':     300,'early_stopping_rounds': 50,'metric': 'custom','boosting_type':    'gbdt','lambda_l1':        0.08758718919397321, 'lambda_l2':        0.0039689175176025465, 'learning_rate':    0.03231007103195577, 'max_depth':        4, 'num_leaves':       128, 'colsample_bytree': 0.8329551585827726, 'colsample_bynode': 0.4025961355653304, 'bagging_fraction': 0.7738954452473223, 'bagging_freq':     4, 'min_data_in_leaf': 85, 'scale_pos_weight': 2.7984184778875543,"device": "gpu"
}
cb_params = {'loss_function':     'Logloss','iterations':        300,'early_stopping_rounds': 50,'verbose':           False,'max_depth':         7, 'learning_rate':     0.06936242010150652, 'scale_pos_weight':  2.6149345838209532, 'l2_leaf_reg':       6.216113851699493,'min_data_in_leaf':  24,'cat_features':      cat_cols,"task_type": "CPU",
}
xgb_params = {'enable_categorical':       True,'tree_method':              'hist','disable_default_eval_metric': 1,'n_estimators':             300,'early_stopping_rounds':    50,'learning_rate':            0.08501257473292347, 'lambda':                   8.879624125465703, 'alpha':                    0.6779926606782505, 'max_depth':                6, 'subsample':                0.6012681388711075, 'colsample_bytree':         0.8437772277074493, 'colsample_bylevel':        0.5476090898823716, 'colsample_bynode':         0.9928601203635129, 'scale_pos_weight':         3.29440313334688,"device":                   "cuda",
}

主流方法分析(图像),深度学习算法提取特征,将图像特征与文本特征一并送入提升树模型

  1. EVA02-small (eva02_small_patch14_336.mim_in22k_ft_in1k) 和EdgeNeXt (edgenext_base.in21k_ft_in1k)
  2. eva02_small,deit3_small,beitv2_base,convnextv2_tiny,swinv2_small, resnext50, convnextv2_nano
  3. swin_tiny,convnextv2_base,convnextv2_large,coatnet_rmlp_1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/69342.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot源码解析(八):Bean工厂接口体系

SpringBoot源码系列文章 SpringBoot源码解析(一):SpringApplication构造方法 SpringBoot源码解析(二):引导上下文DefaultBootstrapContext SpringBoot源码解析(三):启动开始阶段 SpringBoot源码解析(四):解析应用参数args Sp…

Android实训九 数据存储和访问

实训9 数据存储和访问 一、【实训目的】 1、 SharedPreferences存储数据; 2、 借助Java的I/O体系实现文件的存储, 3、使用Android内置的轻量级数据库SQLite存储数据; 二、【实训内容】 1、实现下图所示的界面,实现以下功能: 1&#xff…

python3+TensorFlow 2.x(三)手写数字识别

目录 代码实现 模型解析: 1、加载 MNIST 数据集: 2、数据预处理: 3、构建神经网络模型: 4、编译模型: 5、训练模型: 6、评估模型: 7、预测和可视化结果: 输出结果&#xff…

《深度揭秘:TPU张量计算架构如何重塑深度学习运算》

在深度学习领域,计算性能始终是推动技术发展的关键因素。从传统CPU到GPU,再到如今大放异彩的TPU(张量处理单元),每一次硬件架构的革新都为深度学习带来了质的飞跃。今天,就让我们深入探讨TPU的张量计算架构…

Queries Acceleration -Tuning- Tuning Execution 学习笔记

1 Adjustment of RuntimeFilter Wait Time 1.1 Case: Too Short RuntimeFilter Wait Time 1.1.1 没有看懂,好像是等待时间过小也会导致性能下降 1.1.2 set runtime_filter_wait_time_ms = 3000; 2 Data Skew Handling 2.1 Case 1: Bucket Data Skew Leading to Suboptimal …

React应用深度优化与调试实战指南

一、渲染性能优化进阶 1.1 精细化渲染控制 typescript 复制 // components/HeavyComponent.tsx import React, { memo, useMemo } from react;interface Item {id: string;complexData: {// 复杂嵌套结构}; }const HeavyComponent memo(({ items }: { items: Item[] }) &g…

Python3 OS模块中的文件/目录方法说明十三

一. 简介 前面文章简单学习了 Python3 中 OS模块中的文件/目录的部分函数。 本文继续来学习 OS 模块中文件、目录的操作方法:os.rmdir() 方法、os.stat() 方法。 二. Python3 OS模块中的文件/目录方法说明十三 1. os.rmdir() 方法 os.rmdir() 方法用于删除指定路…

SFTP 使用方法

SFTP(SSH File Transfer Protocol)是一种安全的文件传输协议,通过 SSH(Secure Shell)提供加密的文件传输服务。SFTP 比传统的 FTP 更安全,因为它使用加密来保护传输的数据。 1. 连接到远程主机 首先&#…

Ubuntu 顶部状态栏 配置,gnu扩展程序

顶部状态栏 默认没有配置、隐藏的地方 安装使用Hide Top Bar 或Just Perfection等进行配置 1 安装 sudo apt install gnome-shell-extension-manager2 打开 安装的“扩展管理器” 3. 对顶部状态栏进行配置 使用Hide Top Bar 智能隐藏,或者使用Just Perfection 直…

【信息系统项目管理师-选择真题】2011上半年综合知识答案和详解

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7题】【第8题】【第9题】【第10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第…

spark运行流程

spark运行流程 任务提交后,先启动 Driver 程序随后 Driver 向集群管理器注册应用程序集群管理器根据此任务的配置文件分配 Executor 并启动Driver 开始执行 main 函数,Spark 查询为懒执行,当执行到 Action 算子时开始反向推 算,根…

Formality:时序变换(二)(不可读寄存器移除)

相关阅读 Formalityhttps://blog.csdn.net/weixin_45791458/category_12841971.html?spm1001.2014.3001.5482 一、引言 时序变换在Design Compiler的首次综合和增量综合中都可能发生,它们包括:时钟门控(Clock Gating)、寄存器合并(Register Merging)、…

QGIS3.34绿色版更新

我打包的QGIS3.34在实际工作中方便了很多初次接触GIS的朋友,感到十分欣慰!但由于初次推出也发现了一些问题,本次对该版本进行了一个更新! 还是秉承咱一贯理念,方便您使用也方便您不用!该工具还是被打包为绿…

参数是模型学会的东西,预训练是让它学习的东西

参数 就是模型“学会的东西”。这些参数是模型在训练过程中通过调整其权重来存储的知识。它们代表了模型如何处理输入数据、做出决策和生成输出。每个参数都是模型用来预测和理解语言的一部分。 预训练 就是让模型“学习的过程”。预训练阶段,模型通过大量的文本数…

寒假1.26

题解 web:[极客大挑战 2019]Havefun 打开是一个猫猫的图片 查看源代码 就是一个简单的get传参,直接在url后面输入catdog即可 有点水,再来一题 [极客大挑战 2019]LoveSQL 熟悉的界面,不熟悉的注入 尝试上次的方法,注…

Python GUI 开发 | Qt Designer — 工具介绍

关注这个框架的其他相关笔记:Python GUI 开发 | PySide6 & PyQt6 学习手册-CSDN博客 Qt Designer 即 Qt 设计师,是一个强大、灵活的可视化 GUI 设计工具,可以帮助用户加快开发 PySide6 程序的速度。 Qt Designer 是专门用来制作 PySide6…

【第九天】零基础入门刷题Python-算法篇-数据结构与算法的介绍-六种常见的图论算法(持续更新)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、Python数据结构与算法的详细介绍1.Python中的常用的图论算法2. 图论算法3.详细的图论算法1)深度优先搜索(DFS)2&#xf…

基于回归分析法的光伏发电系统最大功率计算simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 5.完整工程文件 1.课题概述 基于回归分析法的光伏发电系统最大功率计算simulink建模与仿真。选择回归法进行最大功率点的追踪,使用光强和温度作为影响因素,电压作为输出进行建模。…

使用Ollama部署deepseek大模型

Ollama 是一个用于部署和管理大模型的工具,而 DeepSeek 是一个特定的大模型。以下是如何使用 Ollama 部署 DeepSeek 大模型的步骤: 1. 安装 Ollama 首先,你需要在你的系统上安装 Ollama。你可以通过以下命令来安装: # 假设你已…

嵌入式蓝桥杯电子赛嵌入式(第14届国赛真题)总结

打开systic 生成工程编译查看是否有问题同时打开对应需要的文档 修改名称的要求 5.简单浏览赛题 选择题,跟单片机有关的可以查相关手册 答题顺序 先从显示开始看 1,2 所以先打开PA1的定时器这次选TIM2 从模式、TI2FP2二通道、内部时钟、1通道设为直接2通道设置…