Python Day23 学习

继续SHAP图绘制的学习

1. SHAP特征重要性条形图

特征重要性条形图(Feature Importance Bar Plot)是 SHAP 提供的一种全局解释工具,用于展示模型中各个特征对预测结果的重要性。以下是详细解释:

图的含义
- 横轴:表示特征的重要性,通常是特征的 SHAP 值的平均绝对值(`mean(|SHAP value|)`)。
  - SHAP 值的绝对值越大,说明该特征对模型预测的影响越大。
  - 通过取绝对值,可以忽略正负方向,只关注特征对预测结果的贡献大小。
- 纵轴:表示特征名称,按重要性从高到低排序。
  - 排在顶部的特征对模型预测的整体影响最大。

代码实现:

# --- 1. SHAP 特征重要性条形图 (Summary Plot - Bar) ---
print("--- 1. SHAP 特征重要性条形图 ---")
shap.summary_plot(shap_values[:, :, 0], X_test, plot_type="bar",show=False)  #  这里的show=False表示不直接显示图形,这样可以继续用plt来修改元素,不然就直接输出了
plt.title("SHAP Feature Importance (Bar Plot)")
plt.show()

对以下部分代码再进行理解:

shap_values[:, :, 0]

生成图像:

2. SHAP特征重要性蜂巢图

特征重要性蜂巢图(Feature Importance Violin Plot)是 SHAP 提供的一种全局解释工具,用于展示每个特征对模型预测的影响分布情况。以下是详细介绍:


图的含义

  • 横轴SHAP 值,表示特征对模型预测的影响大小和方向

    • 正值:该特征对预测结果有正向影响(推动预测值增大)。
    • 负值:该特征对预测结果有负向影响(推动预测值减小)。
  • 纵轴特征名称,按重要性从高到低排序。

    • 排在顶部的特征对模型预测的整体影响最大。
  • 颜色通常表示特征值的大小(如红色表示特征值较大,蓝色表示特征值较小)。

  • 形状(蜂巢/小提琴形状)表示 SHAP 值的分布。

    • 宽度:表示该特征的 SHAP 值在某个范围内的密度(样本数量)。
    • 宽度越大,说明更多样本的 SHAP 值集中在该范围。

图的作用

  • 全局解释:蜂巢图展示了每个特征对模型预测的影响分布,帮助我们理解特征的重要性和影响方向。
  • 特征与预测的关系
    • 通过颜色和 SHAP 值的分布,可以直观地观察特征值大小与预测结果之间的关系。
    • 例如,红色(特征值大)集中在正 SHAP 值区域,说明特征值越大,对预测结果的正向影响越大。
  • 异常值检测:如果某些特征的 SHAP 值分布异常(如极端值),可能需要进一步检查数据或模型。

特征重要性蜂巢图是 SHAP 的全局解释工具,通过展示每个特征的 SHAP 值分布,帮助我们理解特征对模型预测的影响大小、方向和分布情况。它比条形图提供了更丰富的信息,尤其适合分析特征值与预测结果之间的关系。

代码实现:

# --- 2. SHAP 特征重要性蜂巢图 (Summary Plot - Violin) ---
print("--- 2. SHAP 特征重要性蜂巢图 ---")
shap.summary_plot(shap_values[:, :, 0], X_test,plot_type="violin",show=False,max_display=10) # 这里的show=False表示不直接显示图形,这样可以继续用plt来修改元素,不然就直接输出了
plt.title("SHAP Feature Importance (Violin Plot)")
plt.show()
# 注意下上面几个参数,plot_type可以是bar和violin,max_display表示显示前多少个特征。

生成图像:

今日学习到这里,明日自己练习一下SHAP图的绘制,再进行新内容的学习。继续加油!!!

@浙大疏锦行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/79643.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

.NET 8 + Angular WebSocket 高并发性能优化

.NET 8 Angular WebSocket 高并发性能优化。 .NET 8 WebSocket 高并发性能优化 WebSocket 是一种全双工通信协议,允许客户端和服务端之间保持持久连接。在高并发场景下,优化 WebSocket 的性能至关重要。以下是针对 .NET 8 中 WebSocket 高并发性能优化…

Ubuntu 22.04.5 LTS 基于 kubesphere 安装 cube studio

Ubuntu 22.04.5 LTS 基于 kubesphere 安装 cube studio 前置条件 已经成功安装 kubesphere v4.3.1 参考教程: https://github.com/data-infra/cube-studio/wiki/%E5%9C%A8-kubesphere-%E4%B8%8A%E6%90%AD%E5%BB%BA-cube-studio 1. 安装基础依赖 # ubuntu安装基础依赖 apt insta…

centos 7 安装 java 运行环境

centos 7 安装 java 运行环境 java -version java version "1.8.0_131" Java(TM) SE Runtime Environment (build 1.8.0_131-b11) Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)java -version java version "1.8.0_144" Java(TM) …

Linux系统管理与编程20:Apache

兰生幽谷,不为莫服而不芳; 君子行义,不为莫知而止休。 做好网络和yum配置,用前面dns规划的www的IP进行。 #!/bin/bash #----------------------------------------------------------- # File Name: myWeb.sh # Version: 1.0 # …

.NET 在鸿蒙系统上的适配现状

目录 .NET 在鸿蒙系统上的适配现状 鸿蒙系统对虚拟机的限制与.NET的适配挑战 NativeAOT 在鸿蒙系统中的适配原理与实现方式 已知问题与解决方案:鸿蒙系统中的 syscall 限制 鸿蒙系统适配中的技术难点与解决方案 跨平台编译的挑战与应对策略 依赖库管理与兼容…

kotlin JvmName注解的作用和用途

1. JvmName 注解的作用 JvmName 是 Kotlin 提供的一个注解,用于在编译为 Java 字节码时自定义生成的类名或方法名。 作用对象: 文件级别(整个 .kt 文件)函数、属性、类等成员 主要用途: 控制 Kotlin 编译后生成的 JV…

树莓派4 yolo 11l.pt性能优化后的版本

树莓派4 使用 Picamera2 拍摄图像,然后通过 YOLO11l.pt 进行目标检测,并在实时视频流中显示结果。但当前的代码在运行时可能会比较卡顿,主要原因包括: picam2.capture_array() 是一个较慢的操作;YOLO 推理可能耗时较长…

Docker私有仓库实战:官方registry镜像实战应用

抱歉抱歉,离职后反而更忙了,拖了好久,从4月拖到现在,在学习企业级方案Harbor之前,我们先学习下官方方案registry,话不多说,详情见下文。 注意:下文省略了基本认证 TLS加密&#xff…

MySQL 安全架构:从渗透测试到合规审计

MySQL 安全架构:从渗透测试到合规审计 一、数据库安全的时代挑战与核心需求 在数据成为企业核心资产的今天,MySQL 面临的安全威胁日益复杂。据统计,2024 年全球数据库泄露事件中,关系型数据库占比高达 68%,其中 MySQ…

【基础复习笔记】计算机视觉

目录 一、计算机视觉基础 1. 卷积神经网络原理 2. 目标检测系列 二、算法与模型实现 1. 在PyTorch/TensorFlow中实现自定义损失函数或网络层的步骤是什么? 2. 如何设计一个轻量级模型用于移动端的人脸识别? 3. 描述使用过的一种注意力机制&#…

Django 项目的 models 目录中,__init__.py 文件的作用

在 Django 项目的models/init.py文件中,这些导入语句的主要作用是将各个模型类从不同的模块中导入到models包的命名空间中。这样做有以下几个目的: 简化导入路径 当你需要在项目的其他地方使用这些模型时,可以直接从models包导入&#xff0c…

实现一个简单的 TCP 客户端/服务器

注意: TCP 三次握手建立连接建立连接后,TCP 提供全双工的通信服务,也就是在同一个连接中,通信双方 可以在同一时刻同时写数据,相对的概念叫做半双工,同一个连接的同一时刻,只能由一方来写数据T…

专业课复习笔记 9

前言 学爽了。 为什么哈希函数的空间复杂度是 O(N) 我们实际使用的电话号码的数目是 N &#xff0c;理论上至多有 R 个电话号码&#xff0c;桶数组 bucket array 的容量是 M &#xff0c;满足条件 N < M < < R N<M<<R N<M<<R&#xff0c;因为动…

【论文阅读27】-TCN–BiLSTM -滑坡预测

《A Landslide Displacement Prediction Model Based on the ICEEMDAN Method and the TCN–BiLSTM Combined Neural Network》 发表于 Water 期刊&#xff0c;2023年。 &#x1f4cc; 主要内容概述 这篇论文提出了一种滑坡位移预测模型&#xff0c;结合了&#xff1a; ICEEM…

8b10b编解码仿真

一、基本概念 8B/10B编码&#xff08;8-bit to 10-bit encoding&#xff09;是一种将8位数据&#xff08;包括数据字符和控制字符&#xff09;转换为10位符号&#xff08;Symbol&#xff09;的编码技术&#xff0c;由IBM工程师Al Widmer和Peter Franaszek于1983年提出。其核心思…

23龙信服务器wp

中规中矩的一套服务器&#xff0c;比较简单 1.服务器系统的版本号是___。&#xff08;格式&#xff1a;1.1.1111&#xff09; 2.网站数据库的版本号是___。&#xff08;格式&#xff1a;1.1.1111&#xff09; 3.宝塔面板的“超时”时间是___分钟。&#xff08;格式&#xff1a;…

Redis 存储原理与数据模型(三)

目录 存储结构 存储转换 数据组织 hash 冲突 负载因子 扩容 缩容 渐进式rehash Redis 线程模型 单线程命令处理机制 为什么Redis 命令的单线程快 机制 优化 柔性数组 Redis reactor_io 多线程网络模型 存储结构 key-value键值对通过 hash 的方式存储到数组中value 主要…

langchain4j中使用milvus向量数据库做RAG增加索引

安装milvus向量数据库 官方网址 https://milvus.io/zh 使用docker安装milvus mkdir -p /data/docker/milvus cd /data/docker/milvus wget https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh#在docker中启动milvus sh standalone_emb…

UE5.3 C++ 房屋管理系统(一)

一.框架思路 1.如何加载。房屋管理&#xff0c;既然管理。就存在动态加载&#xff0c;和静态加载的考虑。如果是静态加载&#xff0c;就是在编辑器情况下放置&#xff0c;但这样方便了摆放&#xff0c;但管理就需要在开始是将所有的房屋找到加到管理者里。你无法决定拖入场景的…

4.1【LLaMA-Factory 实战】医疗领域大模型:从数据到部署的全流程实践

【LLaMA-Factory实战】医疗领域大模型&#xff1a;从数据到部署的全流程实践 一、引言 在医疗AI领域&#xff0c;构建专业的疾病诊断助手需要解决数据稀缺、知识专业性强、安全合规等多重挑战。本文基于LLaMA-Factory框架&#xff0c;详细介绍如何从0到1打造一个垂直领域的医…