window 显示驱动开发-使用有保证的协定 DMA 缓冲区模型

Windows Vista 的显示驱动程序模型保证呈现设备的 DMA 缓冲区和修补程序位置列表的大小。 修补程序位置列表包含 DMA 缓冲区中命令引用的资源的物理内存地址。

在有保证的协定模式下,用户模式显示驱动程序知道 DMA 缓冲区和修补程序位置列表的确切大小,当用户模式显示驱动程序填充命令缓冲区并调用 pfnRenderCb 将它们提交到显示微型端口驱动程序时,这些 DMA 缓冲区和修补程序位置列表可供转换。 每次调用 pfnRenderCb 后,用户模式显示驱动程序将收到可用于以下转换 (即对 pfnRenderCb 的以下调用) 的 DMA 缓冲区和修补程序位置列表的大小。

视频内存管理器保证在下一次转换完成之前不会剪裁该设备的 DMA 缓冲区和修补程序位置列表。 显示微型端口驱动程序必须能够将一个命令缓冲区转换为恰好一个 DMA 缓冲区和一个修补程序位置列表。 如果无法进行此转换,则根据定义,用户模式命令缓冲区无效。 显示微型端口驱动程序无法返回状态,指示转换期间它已超过 DMA 缓冲区空间和修补程序位置列表;这样做会导致视频内存管理器错误检查系统,因为内存管理器无法满足保证的 DMA 协定的要求。

1. 核心概念解析

(1) DMA 缓冲区与修补程序位置列表(Patch Location List)

  • DMA 缓冲区:包含 GPU 可执行的硬件指令序列,由内核模式驱动(KMD)从用户模式命令转换而来。
  • 修补程序位置列表:记录 DMA 缓冲区中引用的资源(如纹理、顶点缓冲区)的 物理内存地址,用于运行时重定位(如内存被 VidMm 迁移时)。

(2) 有保证的协定(Guaranteed Contract)

  • 关键保证:VidMm 承诺在每次 pfnRenderCb 调用后,为设备提供 固定大小的 DMA 缓冲区+修补列表空间,直到下次提交完成。
  • 违反后果:若 KMD 无法在给定空间内完成转换,系统会触发 bugcheck(蓝屏),因为协定被破坏。

2. 工作流程与责任划分

sequenceDiagramparticipant UMD as 用户模式驱动(UMD)participant VidMm as 视频内存管理器participant KMD as 内核模式驱动(KMD)participant GPU as GPU硬件UMD->>VidMm: 1. 初始化时获取DMA缓冲区大小VidMm-->>UMD: 返回保证的DMA缓冲区/修补列表大小loop 每帧渲染UMD->>UMD: 2. 生成命令缓冲区(用户空间)UMD->>KMD: 3. 调用pfnRenderCb提交KMD->>KMD: 4. 验证并转换命令alt 转换成功KMD->>GPU: 5. 提交DMA缓冲区+修补列表KMD->>VidMm: 6. 返回执行状态VidMm->>UMD: 7. 更新下次可用缓冲区大小else 转换失败(空间不足)KMD->>System: 触发bugcheckendend


3. 开发者视角的实现要求

用户模式驱动(UMD)责任

// 示例:UMD提交命令的典型流程
void UmdSubmitCommands() {// 1. 从VidMm获取当前可用空间D3DDDICB_RENDER renderCB = {0};pfnGetCaps(D3DDDICAPS_GET_DMA_BUFFER_SIZE, &renderCB);// 2. 生成不超过限制的命令BYTE* cmdBuffer = AllocCommandBuffer(renderCB.DmaBufferSize);GenerateCommands(cmdBuffer, renderCB.DmaBufferSize);// 3. 提交并获取下次空间HRESULT hr = pfnRenderCb(&renderCB);if (SUCCEEDED(hr)) {UINT nextBufferSize = renderCB.NextDmaBufferSize; // 更新下次可用大小}
}

内核模式驱动(KMD)责任

// 在DxgkDdiRender回调中的处理
NTSTATUS DxgkDdiRender(IN_CONST_HANDLE hContext,INOUT_PDXGKARG_RENDER pRender)
{// 1. 必须在保证空间内完成转换if (pRender->DmaBufferSize < RequiredSpace()) {return STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER; // 实际上会触发bugcheck}// 2. 转换命令到DMA格式ConvertToDmaBuffer(pRender->pCommand, pRender->DmaBuffer, pRender->DmaBufferSize);// 3. 填充修补位置列表GeneratePatchList(pRender->PatchLocationList,pRender->PatchLocationListSize);return STATUS_SUCCESS;
}

4. 关键设计原理

(1) 为什么需要固定大小保证?

  • 确定性执行:避免动态内存分配导致的不确定性延迟。
  • 安全隔离:防止用户模式驱动通过故意溢出引发内核内存损坏。
  • 性能优化:固定大小便于预分配内存池,减少运行时开销。

(2) 修补列表的物理地址重定位
当 VidMm 迁移资源内存时(如显存不足时逐出到系统内存),只需更新修补列表中的物理地址,无需修改 DMA 缓冲区本身:

// VidMm 的迁移处理示例
void VidMmRelocateResource(RESOURCE* res, PHYSICAL_ADDRESS newAddr) {foreach (PatchEntry* entry in res->PatchLocations) {*entry->DmaBufferPtr = newAddr; // 更新GPU指令中的地址}
}

5. 违反协定的典型场景

错误类型后果调试方法
DMA 缓冲区溢出立即触发 VIDEO_TDR_FAILURE bugcheck检查 KMD 的转换逻辑大小计算
修补列表溢出同上验证资源引用计数
无效命令引用可能延迟触发 GPU 挂起使用 PIX 捕获命令缓冲区
未处理的页面错误GPU 访问违例检查修补列表是否覆盖所有资源引用

6. 现代演进(Windows 10+)

  • 弹性内存管理:Windows 10 引入部分弹性分配,但核心协定仍保留。
  • 直接提交(Direct Submission):允许绕过部分验证,但需驱动显式声明能力。
  • GPU 虚拟内存:物理地址重定位需求减少,但修补列表机制仍存在以兼容旧硬件。

总结

WDDM 的 DMA 保证协定通过:

  1. 固定大小预分配 确保确定性
  2. 严格空间强制 维护系统稳定性
  3. 物理地址重定向 实现内存虚拟化

开发者必须:

  1. UMD 严格遵守大小限制
  2. KMD 确保转换绝不溢出
  3. 利用修补列表处理资源迁移

这种设计平衡了性能、安全与灵活性,是 Windows 图形栈稳定性的基石。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/905887.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SD-HOST Controller design-----SD CLK 设计

hclk的分频电路&#xff0c;得到的分频时钟作为sd卡时钟。 该模块最终输出两个时钟&#xff1a;一个为fifo_sd_clk,另一个为out_sd_clk_dft。当不分频时&#xff0c;fifo_sd_clk等于hclk&#xff1b;当分频时候&#xff0c;div_counter开始计数&#xff0c;记到相应分频的时候…

完全背包问题中「排列数」与「组合数」的核心区别

&#x1f3af; 一句话理解 求组合数&#xff08;不计顺序&#xff09; → 外层遍历物品&#xff0c;内层遍历背包容量 求排列数&#xff08;计顺序&#xff09; → 外层遍历背包容量&#xff0c;内层遍历物品 &#x1f3b2; 举例说明 假设有硬币 [1, 2, 3]&#xff0c;目标金…

NHANES指标推荐:MDS

文章题目&#xff1a;The association between magnesium depletion score (MDS) and overactive bladder (OAB) among the U.S. population DOI&#xff1a;10.1186/s41043-025-00846-x 中文标题&#xff1a;美国人群镁耗竭评分 &#xff08;MDS&#xff09; 与膀胱过度活动症…

C++:字符串操作函数

strcpy() 功能&#xff1a;把一个字符串复制到另一个字符串。 #include <iostream> #include <cstring> using namespace std;int main() {char src[] "Hello";char dest[10];strcpy(dest, src);cout << "Copied string: " << …

1基·2台·3空间·6主体——蓝象智联解码可信数据空间的“数智密码”

近日&#xff0c;由全国数据标准化技术委员会编制的《可信数据空间 技术架构》技术文件正式发布&#xff0c;标志着我国数据要素流通体系向标准化、规范化迈出关键一步。该文件从技术功能、业务流程、安全要求三大维度对可信数据空间进行系统性规范&#xff0c;为地方、行业及企…

基于TI AM6442+FPGA解决方案,支持6网口,4路CAN,8个串口

TI AM6442FPGA解决方案具有以下技术优势及适用领域&#xff1a; 一、技术优势 ‌异构多核架构‌&#xff1a;AM6442处理器集成7个内核&#xff08;2xCortex-A534xCortex-R5F1xCortex-M4F&#xff09;&#xff0c;可实现应用处理、实时控制和独立任务分核协同&#xff0c;满足…

android vlc播放rtsp

最近在做IOT开发&#xff0c;需要把IOT设备的RTSP流在手机端播放&#xff0c;VLC是个不错的选择&#xff0c;使用起来简单方便。 1、在AndroidManifest.xml 中添加网络权限 <uses-permission android:name"android.permission.INTERNET"/> <uses-permissi…

前端面经 9 JS中的继承

借用Class实现继承 实现继承 extends super extends 继承父类 super调用父类的构造函数 子类中存在方法采取就近原则 &#xff0c;子类构造函数需要使用super()调用父类的构造函数 JS 静态属性和私有属性 寄生组合式继承

jQuery知识框架

一、jQuery 基础 核心概念 $ 或 jQuery&#xff1a;全局函数&#xff0c;用于选择元素或创建DOM对象。 链式调用&#xff1a;多数方法返回jQuery对象&#xff0c;支持连续操作。 文档就绪事件&#xff1a; $(document).ready(function() { /* 代码 */ }); // 简写 $(function…

【HCIA】BFD

前言 前面我们介绍了浮动路由以及出口路由器的默认路由配置&#xff0c;可如此配置会存在隐患&#xff0c;就是出口路由器直连的网络设备并不是运营商的路由器&#xff0c;而是交换机。此时我们就需要感知路由器的存活状态&#xff0c;这就需要用到 BFD&#xff08;Bidirectio…

前端流行框架Vue3教程:18. _组件数据传递

透传 Attributes 透传attribute指的是传递给一个组件&#xff0c;却没有被该组件声明为props或emits的attribute或者v-on事件监听器。最常见的例子就是class、style和id 当一个组件以单个元素为根作渲染时&#xff0c;透传的attribute会自动被添加到根元素上 透传 Attributes …

卓力达电铸镍网:精密制造与跨领域应用的创新典范

目录 引言 一、电铸镍网的技术原理与核心特性 二、电铸镍网的跨领域应用 三、南通卓力达电铸镍网的核心优势 四、未来技术展望 引言 电铸镍网作为一种兼具高精度与高性能的金属网状材料&#xff0c;通过电化学沉积工艺实现复杂结构的精密成型&#xff0c;已成为航空航天、电…

1.2.3.2 数据安全发展历程-大数据安全产品领域

从电商到物流&#xff1a;中国大数据安全产品如何进化&#xff1f; 在数字化时代&#xff0c;我们的一举一动都可能被记录——购物记录、聊天信息、位置轨迹……这些数据不仅关系到个人隐私&#xff0c;更涉及企业运营和国家安全的命脉。近年来&#xff0c;随着数据的爆发式增长…

服务器性能参数分析基础:磁盘-CPU-内存

在Linux系统中&#xff0c;"挂载"&#xff08;Mount&#xff09;是指将物理存储设备&#xff08;如磁盘分区&#xff09;或逻辑存储卷&#xff08;如LVM、网络存储&#xff09;关联到文件系统目录树的特定路径节点&#xff08;即挂载点&#xff09;&#xff0c;使得该…

密码学刷题小记录

base 64 打开后发现是一串字符串&#xff0c;&#xff0c;我们直接进行base64解密即可 Caesar 根据标题分析&#xff0c;我们知道这是凯撒解密&#xff0c;拖进去经过尝试在偏移量为12时直接得解&#xff08;这道题就是找偏移量比较麻烦&#xff09; Morse 这道题打开后&am…

Spring框架(三)

目录 一、JDBC模板技术概述 1.1 什么是JDBC模板 二、JdbcTemplate使用实战 2.1 基础使用&#xff08;手动创建对象&#xff09; 2.2 使用Spring管理模板类 2.3 使用开源连接池&#xff08;Druid&#xff09; 三、模拟转账开发 3.1 基础实现 3.1.1 Service层 3.1.2 Da…

[计算机网络]网络层

文章目录 408考研大纲IPV4数据报格式协议: IPv4 地址DHCP协议IP组播 408考研大纲 IPV4数据报格式 协议: 1:ICMP 6:TCP 17:UDP IPv4 地址 特殊IP 网络号全1又称直接广播地址&#xff0c;32位全1又称受限广播地址 因为255.255.255.255只能在本网络内广播&#xff0c;路由器不…

影楼精修-肤色统一算法解析

注意&#xff1a;本文样例图片为了避免侵权&#xff0c;均使用AIGC生成&#xff1b; 本文介绍影楼精修中肤色统一算法的实现方案&#xff0c;并以像素蛋糕为例&#xff0c;进行分析说明。 肤色统一就是将人像照片中皮肤区域的颜色进行统一&#xff0c;看起来颜色均匀一致&…

计算机网络:什么是计算机网络?它的定义和组成是什么?

计算机网络是指通过通信设备和传输介质&#xff0c;将分布在不同地理位置的计算机、终端设备及其他网络设备连接起来&#xff0c;实现资源共享、数据传输和协同工作的系统。其核心目标是使设备之间能够高效、可靠地交换信息。 关键组成部分 硬件设备 终端设备&#xff1a;如计算…

深度学习---获取模型中间层输出的意义

一、什么是 Hook&#xff08;钩子函数&#xff09;&#xff1f; 在 PyTorch 中&#xff0c;Hook 是一种机制&#xff0c;允许我们在模型的前向传播或反向传播过程中&#xff0c;插入自定义的函数&#xff0c;用来观察或修改中间数据。 最常用的 hook 是 forward hook&#xf…