升级 CUDA Toolkit 12.9 与 cuDNN 9.9.0 后验证指南:功能与虚拟环境检测

#工作记录

在 NVIDIA 发布 CUDA Toolkit 12.9 与 cuDNN 9.9.0 后,开发者纷纷选择升级以获取新特性和性能提升。

CUDA Toolkit 12.9 与 cuDNN 9.9.0 发布,带来全新特性与优化-CSDN博客

然而,升级完成并不意味着大功告成,确认升级后功能正常,且对 Windows 系统上原有的 conda 和 virtualenv 等虚拟环境无影响至关重要。

以下是详细的验证步骤和方法。

一、验证 CUDA Toolkit 12.9 功能

1. 检查 CUDA 编译器

打开 Windows 命令提示符,输入nvcc -V并回车。若安装正确,命令行将返回 CUDA Toolkit 12.9 的版本信息,如 “Cuda compilation tools, release 12.9, V12.9.103”。

nvcc -V

C:\Users\love>nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Wed_Apr__9_19:29:17_Pacific_Daylight_Time_2025
Cuda compilation tools, release 12.9, V12.9.41
Build cuda_12.9.r12.9/compiler.35813241_0 

若未显示对应信息或提示命令未找到,说明 CUDA 编译器安装存在问题,可能需要重新安装或检查系统环境变量配置。

2. 运行 CUDA 示例项目

CUDA Toolkit 安装目录(默认路径为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.9\extras\demo_suite )下包含可直接运行的示例程序。

以deviceQuery为例,可通过以下方式运行:

.\deviceQuery.exe

打开 CMD 或 PowerShell,使用cd命令导航到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.9\extras\demo_suite 目录,然后运行.\deviceQuery.exe 。

若运行结果中出现类似以下信息:


Detected 1 CUDA Capable device(s)

Device 0: "NVIDIA GeForce RTX 3090"

CUDA Driver Version / Runtime Version 12.9 / 12.9

CUDA Capability Major/Minor version number: 8.6

Total amount of global memory: 24576 MBytes (25769279488 bytes)

...

Result = PASS

则表明 CUDA 能够正确识别 GPU 设备,且基本的设备查询功能正常,GPU 加速功能初步可用。

二、验证 CUDA Toolkit 12.9 与 cuDNN 9.9.0 在虚拟环境中的功能

1. 检查 conda 虚拟环境

打开命令提示符,输入conda activate [虚拟环境名称],将目标 conda 虚拟环境激活。

例如,若虚拟环境名为 “myenv”,则输入conda activate myenv。

“100% 成功的 PyTorch CUDA GPU 支持” 安装攻略-CSDN博客

在激活的 conda 虚拟环境中,运行以下验证代码:

使用 PyTorch 验证

import torch  # 导入 PyTorch 库print("PyTorch 版本:", torch.__version__)  # 打印 PyTorch 的版本号# 检查 CUDA 是否可用,并设置设备("cuda:0" 或 "cpu")
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("设备:", device)  # 打印当前使用的设备
print("CUDA 可用:", torch.cuda.is_available())  # 打印 CUDA 是否可用
print("cuDNN 已启用:", torch.backends.cudnn.enabled)  # 打印 cuDNN 是否已启用# 打印 PyTorch 支持的 CUDA 和 cuDNN 版本
print("支持的 CUDA 版本:", torch.version.cuda)
print("cuDNN 版本:", torch.backends.cudnn.version())# 创建两个随机张量(默认在 CPU 上)
x = torch.rand(5, 3)
y = torch.rand(5, 3)# 将张量移动到指定设备(CPU 或 GPU)
x = x.to(device)
y = y.to(device)# 对张量进行逐元素相加
z = x + y# 打印结果
print("张量 z 的值:")
print(z)  # 输出张量 z 的内容

若输出显示torch.cuda.is_available()为True,且支持的 CUDA 版本、cuDNN 版本信息与预期相符,张量运算能在 GPU 设备上正常执行,说明 CUDA Toolkit 12.9 与 cuDNN 9.9.0 在该 conda 虚拟环境中功能正常。

附件1

使用 TensorFlow 验证

import tensorflow as tfprint(tf.test.is_gpu_available())print(tf.config.list_physical_devices('GPU'))

若tf.test.is_gpu_available()返回True,且能正确列出系统中的 GPU 设备,则表示 TensorFlow 可借助 CUDA 和 cuDNN 在该虚拟环境中使用 GPU 加速功能。

2. 检查 virtualenv 虚拟环境

进入 virtualenv 虚拟环境对应的 Scripts 目录(例如虚拟环境安装在F:\PythonProjects\SkyReels-V2,则进入F:\PythonProjects\SkyReels-V2),在命令提示符中运行.venv\Scripts\activate激活虚拟环境,然后输入python进入python环境。

.venv\Scripts\activate

(.venv) PS F:\PythonProjects\SkyReels-V2> 

python

(.venv) PS F:\PythonProjects\SkyReels-V2> python
Python 3.10.16 | packaged by Anaconda, Inc. | (main, Dec 11 2024, 16:19:12) [MSC v.1929 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>>  

在激活的 virtualenv 虚拟环境中,同样运行上述 PyTorch 和 TensorFlow 的验证代码。若运行结果与在 conda 虚拟环境下类似,即各框架能正确识别 CUDA 和 cuDNN,且可利用 GPU 进行运算,则可确认升级 CUDA Toolkit 12.9 和 cuDNN 9.9.0 对该 virtualenv 虚拟环境无不良影响。

附件2

根据在 conda 虚拟环境和 virtualenv 虚拟环境中的验证情况(见图片附件 1、附件 2):

  • 在 conda 虚拟环境中,PyTorch 版本为2.8.0.dev20256327+cu128,检测到设备为cuda:0 ,CUDA 可用返回TruecuDNN 已启用返回True,支持的 CUDA 版本为12.8 ,cuDNN 版本为90791 。最终张量运算结果正常,且运行在device='cuda:0' 上。
  • 在 virtualenv 虚拟环境中,PyTorch 版本为2.5.1+cu124 ,检测到设备为cuda:0 ,CUDA 可用返回TruecuDNN 已启用返回True,支持的 CUDA 版本为12.4 ,cuDNN 版本为98108 。最终张量运算结果正常,且运行在device='cuda:0' 上。
    若出现异常,如torch.cuda.is_available()返回False,可能是 CUDA、cuDNN 或 PyTorch 安装存在问题,需进一步排查。

三、总结

关于兼容性和验证时显示的版本问题

在深度学习领域,CUDA、cuDNN 和 torch 之间具备向下兼容特性。这得益于它们的自动适配安装机制,会依据当前环境以及已有库状况,安装最合适版本,所以开发者无需因验证版本号与安装版本号不一致而忧心。

目前,torch 官方尚未发布支持 CUDA 12.9 的版本。当在 Windows 主系统完成 CUDA Toolkit 12.9 与 cuDNN 9.9.0 升级后,若未在 conda、virtualenv 等虚拟环境中另行安装适配新版本的库,验证时会呈现虚拟环境中原先的版本信息。

比如,即便主系统已安装 cuDNN 9.9.0,可虚拟环境若未变动安装,验证时仍可能显示为 9070(即原安装的 9.7 版本 )或其他原版本号。

关于验证目的性的回归说明

而进行这些验证,主要是为确认在 Windows 主系统中完成 CUDA Toolkit 12.9 与 cuDNN 9.9.0 升级后,不会对系统内包括 conda、virtualenv 等虚拟环境中的 CUDA、cuDNN 及其他库的正常使用造成影响,保证升级安装基本不会干扰生产力环境。

通过以上对 CUDA Toolkit 12.9、cuDNN 9.9.0 功能的验证,以及在 conda 和 virtualenv 虚拟环境中的测试,开发者能够全面确认升级操作的有效性和稳定性,确保后续基于 GPU 加速的开发工作顺利进行。

若在验证过程中遇到问题,可参考 NVIDIA 官方文档、相关开源社区或技术论坛寻求解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/904174.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM论文笔记 28: Universal length generalization with Turing Programs

Arxiv日期:2024.10.4机构:Harvard University 关键词 图灵机 CoT 长度泛化 核心结论 Turing Programs 的提出 提出 Turing Programs,一种基于图灵机计算步骤的通用 CoT 策略。通过将算法任务分解为逐步的“磁带更新”(类似图灵…

【全队项目】智能学术海报生成系统PosterGenius--图片布局生成模型LayoutPrompt(1)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀大模型实战训练营_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 1. 前…

位图的实现和拓展

一:位图的介绍 ①:需要位图的场景 给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中? 要判断一个数是否在某一堆数中,我们可能会想到如下方法: A…

排序功法入门指南【江湖算法笔记】

话说江湖风云变幻,各路英雄好汉行走江湖,总得有个名号排行。若问“东邪西毒南帝北丐”谁强谁弱,总得排个座次不是?这排序之道,恰似武功秘籍,练好了能号令群雄,练岔了怕是要被笑掉大牙&#xff0…

【中间件】brpc_基础_用户态线程中断

bthread之用户态线程中断 源码 1 简介 interrupt_pthread 核心功能是 通过信号机制中断阻塞的 pthread 线程,以实现线程的协作式中断。 2 核心功能与设计 2.1 信号选择与注册 信号选择:使用 SIGURG 作为中断信号。 原因:SIGURG 通常用于…

Linux 的网络卡

#本机操作系统CentOS 10 #核心版本 rootbogon:/etc# uname -r 6.12.0-65.el10.x86_64 网卡能不能被捉到可以使用【dmesg|grep xx】来判断,有没有驱动则可以使用lsmod看看模块有没有加载核心!最后,以ifconfig xxx测试看看 观察核心所捉到的网卡…

前端双工通信的几种方案详细描述

前端实现双工通信(全双工或半双工)的常见方案及详细实现如下: 一、WebSocket(全双工) 原理:基于 TCP 的持久化协议,客户端与服务端建立双向通信通道,支持实时双向数据传输。 // 客…

KUKA机器人快速启动设置

KUKA机器人在首次开机启动时,有时在示教器上需要进行投入运行等相关的设置。如以下相关的信息需要处理: 1、机器人系统开机后,选择T1运行模式;2、显示提示信息:“RDC 存储器和控制系统不一致什么被更换了”时&#xf…

游戏代码C

以下将结合不同编程语言的特点及游戏开发中的实际应用,展示多种语言的游戏代码示例(以简单游戏为例,展示代码结构和逻辑差异)。由于代码篇幅较长,我将分语言进行说明并引用相关来源: 1. C# Unity&#xff…

LangChain Agent核心解析:Zero-Shot-ReAct策略实现与实战指南

引言 在LangChain的Agent框架中,zero-shot-react-description 是一种预定义的Agent类型,它结合了Zero-Shot(零样本学习) 和 ReAct(推理行动) 策略,主要用于根据工具的描述动态选择和执行工具&a…

PyQt 或 PySide6 进行 GUI 开发文档与教程

一、官网文档 Qt 官方文档:Porting to Qt 6 | Qt 6.9Qt 维基:​​​​​​​Qt WikiQt for Python (PySide6) :​​​​​​​Qt for Python - Qt WikiPySide6 快速上手指南:​​​​​​​Getting Started - Qt for Python PyS…

2024年第十五届蓝桥杯省赛B组Python【 简洁易懂题解】

2024年第十五届蓝桥杯省赛B组Python题解 一、整体情况说明 2024年第十五届蓝桥杯省赛B组Python组考试共包含8道题目,分为结果填空题和程序设计题两类。 考试时间:4小时编程环境:Python 3.x,禁止使用第三方库,仅可使…

Go语言--语法基础4--基本数据类型--类型转换

Go 是一种强类型的语言,所以如果在赋值的时候两边类型不一致会报错。一个类型的值可以被转换成另一种类型的值。由于 Go 语言不存在隐式类型转换,因此所有的类型转换都必须显式的声明。 强制类型转换语法 使用 type (a) 这种形式来进行强制类型转换&am…

nginx 代理时怎么更改 Remote Address 请求头

今天工作中遇到用 localhost 访问网站能访问后台 api,但是用本机IP地址后就拒绝访问,我怀疑是后台获取 Remote Address 然后设置白名单了只能 localhost 访问。 想用 nginx 更改 Remote Address server {listen 8058;server_name localhost;loca…

LeetCode刷题链表

文章目录 链表总结 常用技巧两数相加题解代码 两两交换链表中的节点题解代码 重排链表题解代码 合并k个升序链表题解代码 K个一组翻转链表题解代码 链表总结 常用技巧 画图 直观 形象 便于理解引入虚拟头节点,便于处理边界情况,方便我们对链表进行…

ESP32S3 多固件烧录方法、合并多个固件为单一固件方法

ESP32S3 多固件烧录方法、合并多个固件为单一固件方法 文章目录 ESP32S3 多固件烧录方法、合并多个固件为单一固件方法前言1、前期准备工作2、多固件烧录方法3、单固件烧录方法总结 前言 使用正点原子的ESP32S3 BOX开发板独立烧录编译生成的xxx.bin固件无法正常运行起来&#…

Webug4.0靶场通关笔记10- 第14关链接注入

目录 第14关 链接注入 1.打开靶场 2.源码分析 3.渗透实战 (1)方法1:跳转外部网页 (2)方法2:获取cookie 4.漏洞防御 本文通过《webug靶场第14关 链接注入》来进行渗透实战。 第14关 链接注入 链接注…

SpringBoot的汽车商城后台管理系统源码开发实现

概述 汽车商城后台管理系统专为汽车4S店和经销商设计,提供全面的汽车管理系统解决方案。 主要内容 1. 核心功能模块 系统提供以下主要功能: ​​销售管理​​:记录销售信息,跟踪交易进度​​客户管理​​:维护客户…

VBA代码解决方案第二十四讲:EXCEL中,如何删除重复数据行

《VBA代码解决方案》(版权10028096)这套教程是我最早推出的教程,目前已经是第三版修订了。这套教程定位于入门后的提高,在学习这套教程过程中,侧重点是要理解及掌握我的“积木编程”思想。要灵活运用教程中的实例像搭积木一样把自己喜欢的代码…

日本IT行业|salesforce开发语言占据的地位

在日本的IT行业中,Salesforce 开发语言处于一个较为专业但稳步增长的细分领域,并不是主流开发语言(如 Java、Python、PHP),但其在某些行业和场景中地位越来越重要。 本篇以下是详细分析: Salesforce开发语言…