Windows 图形显示驱动开发-WDDM 3.0功能- 硬件翻转队列(一)

WDDM 3.0 之前的翻转队列模型

许多新式显示控制器支持对按顺序显示的多个帧排队的能力。 从 WDDM 2.1 开始,OS 支持将在下一个 VSync 中显示的多个未完成的翻转覆盖请求。 显示微型端口驱动程序 (KMD) 通过 DXGK_DRIVERCAPS 中的 MaxQueuedMultiPlaneOverlayFlipVSync 值来表示这种支持。 此功能对于减少高帧速率游戏方案中的延迟非常有用,在这种方案中,多个帧以间隔 0 依次呈现,目的是只显示最近的帧。

在视频播放方案中,要按顺序显示的多个未来帧的内容是预先已知的,并且可以排队到 GPU。 这种提前排队允许 CPU 在处理排队帧时进入低功率状态,从而节省大量电源。 但是,在 WDDM 3.0 之前,OS 没有机制提交需要在屏幕上保留至少一个 VSync 间隔的帧,而无需进一步的 CPU 干预。 基本硬件翻转队列一节介绍了一种解决方案,该解决方案使 CPU 能够进入低功耗状态,并将排队的帧处理卸载到 GPU。

在 WDDM 3.0 之前的游戏方案中,GPU 完成将场景呈现到交换链后缓冲区后,会有一个到 CPU 的往返,以便将请求提交以将帧内容呈现到屏幕。 对于接近 VSync 的繁重 GPU 工作负荷,此往返可能会导致帧延迟并错过预期目标时间,从而导致可观察的帧故障。 “高级硬件翻转队列”部分引入了一种机制,用于避免此 CPU 往返,并将已完成的帧呈现给屏幕且延迟较低。 高级硬件翻转队列要求同时具有基本硬件翻转队列和 GPU 硬件计划阶段 2 功能。

基本硬件翻转队列

下图演示了呈现三个帧的情况,每个帧在屏幕上停留一个 VSync 间隔

 

示意图中的填充图案显示了 Dxgkrnl 软件翻转队列处理和应用程序线程必须唤醒并执行 CPU 工作的时间。 在每个 VSync 上,显示控制器必须向 OS 发出完成翻转的 CPU 通知,并且 OS 必须提交下一个翻转请求。 应用程序还必须在每个 VSync 上唤醒,并查询当前统计信息,以最终了解三帧中的最后一帧何时显示。

从 WDDM 3.0 开始,提供了可以向显示控制器队列提交多个未来帧的硬件翻转队列 DDI。 如前所述,此机制允许 GPU 的 CPU 和部分在显示控制器处理多个排队帧时转换到较低电源状态。 此转换可提高支持硬件的视频播放方案的电源效率。

下图说明了建议的体系结构。

借助硬件翻转队列方法,应用程序和 Dxgkrnl CPU 组件在 v2 和 v4 时间之间的两个 VSync 间隔内处于完全空闲状态,从而使 CPU 能够进入低功耗状态。 只有当应用程序请求等待的帧 N+2 完成时,CPU 才会得到通知。

高级硬件翻转队列

在 WDDM 3.0 之前的游戏方案中,GPU 完成将场景呈现到交换链后缓冲区后,会有一个到 CPU 的往返,以便将请求提交以将帧内容呈现到屏幕。 下图显示了此方案。

如果呈现完成得离 VSync 太近,这种往返的代价可能会导致帧错过目标,如下图所示。

 

一些显示器控制器本身支持等待条件,允许显示在 GPU 完成呈现帧时提交翻转请求,而无需 CPU 往返。 由于硬件翻转队列可以将已完成的帧 N 提交到没有 CPU 往返的显示器,因此它可能会避免错过的帧,如下图所示:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/73654.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《Python深度学习》第二讲:深度学习的数学基础

本讲来聊聊深度学习的数学基础。 深度学习听起来很厉害,其实它背后是一些很有趣的数学原理。本讲会用简单的方式解释这些原理,还会用一些具体的例子来帮助你理解。 2.1 初识神经网络 先从一个简单的任务开始:识别手写数字。 想象一下,你有一堆手写数字的图片,你想让计算…

车载DoIP测试 --- CANoe DoIP中如何配置路由激活请求中的 OEM 特定场(RoutingActivationWithOEMSpecific)

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 简单,单纯,喜欢独处,独来独往,不易合同频过着接地气的生活,除了生存温饱问题之外,没有什么过多的欲望,表面看起来很高冷,内心热情,如果你身…

JDBC数据库连接池技术详解——从传统连接方式到高效连接管理

1. 引言 在开发数据库应用时,我们通常需要与数据库建立连接并执行SQL语句。传统的JDBC连接方式虽然简单直接,但在高并发场景下容易带来性能问题,甚至导致系统崩溃。因此,引入数据库连接池(Connection Pool&#xff09…

【工具类】PDF文件转图片

PDF文件转文件 1. 引入Maven依赖 主要使用了 pdfbox 包与 hutool 包。 pdfbox 负责 pdf 到图片的转换&#xff1b; hutool 负责文件读取转换。 <dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version…

使用DeepSeek,优化斐波那契数函数,效果相当不错

下面这段代码定义了一个递归函数 fibonacci&#xff0c;用于计算第 n 个斐波那契数。 def fibonacci(n):if n < 1:return nelse:return fibonacci(n - 1) fibonacci(n - 2)虽然代码逻辑正确&#xff0c;但其性能较差&#xff0c;尤其是对于较大的 n 值&#xff0c;其复杂度…

Forward Looking Radar Imaging by Truncated Singular Value Decomposition 论文阅读

Forward Looking Radar Imaging by Truncated Singular Value Decomposition and Its Application for Adverse Weather Aircraft Landing 1. 论文的研究目标与意义1.1 研究目标1.2 实际问题与意义2. 论文的创新方法与公式解析2.1 信号建模与问题转化2.2 截断奇异值分解(TSVD)…

provide/inject源码实现

在 Vue 3 中&#xff0c;provide 和 inject 是通过 Vue 的响应式系统和组件实例机制实现的&#xff0c;底层是依赖 Vue 3 中的 Proxy 和 Reactive 来实现跨层级的数据传递和响应式绑定。以下是一个简化版的实现逻辑&#xff0c;帮助理解 Vue 3 中 provide 和 inject 是如何实现…

Unix时间戳BKP备份寄存器RTC实时时钟

Unix时间戳 Unix时间戳&#xff0c;也称为POSIX时间或Epoch时间&#xff0c;是一种在Unix和类Unix操作系统中使用的时间表示方法。它表示的是自1970年1月1日00:00:00 UTC&#xff08;协调世界时&#xff09;至当前时间经过的秒数&#xff0c;不考虑闰秒。Unix时间戳通常以秒为…

【Linux内核系列】:进程板块与文件板块的综合

&#x1f525; 本文专栏&#xff1a;Linux &#x1f338;作者主页&#xff1a;努力努力再努力wz &#x1f4aa; 今日博客励志语录&#xff1a; 人生中成功只是一时的&#xff0c;失败却是人生的主旋律&#xff0c;但是如何面对失败却把人分成了不同的样子&#xff0c;有的人会被…

CellOracle|基因扰动研究基因功能|基因调控网络+虚拟干预

在gzh“生信小鹏”同步文章 论文来源: 发表期刊:Nature发表时间:2023年2月23日论文题目:Dissecting cell identity via network inference and in silico gene perturbation研究团队:Kenji Kamimoto 等,华盛顿大学医学院1. 研究背景与问题提出 细胞身份(Cell Identit…

专线、云 和 物联网(IoT)

专线、云 和 物联网&#xff08;IoT&#xff09; 是现代信息与通信技术&#xff08;ICT&#xff09;领域的三大重要组成部分&#xff0c;它们在企业和个人的数字化转型中扮演着关键角色。以下是对这三者的详细介绍及其相互关系&#xff1a; 1. 专线&#xff08;Leased Line&…

[Lc14_priority_queue] 最后一块石头重量 | 数据流中的第 K 大元素 | 前K个高频单词 | 数据流的中位数

目录 1.最后一块石头的重量 题解 2.数据流中的第 K 大元素 题解 3.前K个高频单词 题解 代码 ⭕4.数据流的中位数 题解 在C中&#xff0c;使用标准库中的priority_queue&#xff0c;默认情况下它是一个最大堆&#xff08;即大堆排序&#xff09;&#xff0c;这意味着最…

XSS漏洞靶场---(复现)

XSS漏洞靶场—&#xff08;复现&#xff09; 反射型 XSS 的特点是攻击者诱导用户点击包含恶意脚本的 URL&#xff0c;服务器接收到请求后将恶意脚本反射回响应页面&#xff0c;浏览器执行该脚本从而造成攻击&#xff0c;恶意脚本不会在服务器端存储。 Level 1(反射型XSS) 此漏…

2025/3.17 郭院安排会议与南京银行参访

目录 *郭院会议&#xff1a;服务外包*1.会遇到的问题以及解决方案2.考虑行业目前会碰到的瓶颈3.后端应该呈现处理图像的过程4.记得做报告、文档说明和视频等工作 *南京银行&#xff08;鑫合易家&#xff09;参访记录*1. 风险评分业务流程笔记![在这里插入图片描述](https://i-b…

Cloud Ace 宣布成为 Langfuse 亚太地区首个代理商,提供 LLM 全链路解决方案

Cloud Ace 宣布正式代理 Langfuse 产品&#xff0c;是 Langfuse 在亚太地区唯一的官方授权经销商&#xff0c;全面负责其商用许可证的销售、部署与技术支持服务。通过此次合作&#xff0c;Cloud Ace 将充分发挥 Langfuse 的先进技术能力与行业专业知识&#xff0c;为企业级客户…

Helm 的仓库管理与 Chart 搜索

在使用 Helm 管理 Kubernetes 应用的过程中&#xff0c;仓库管理与 Chart 搜索是两个核心功能。通过 Helm 仓库&#xff0c;用户可以方便地存储、分享和获取 Helm Chart&#xff0c;而搜索功能则帮助用户快速找到所需的 Chart。本文将详细介绍 Helm 仓库的概念、管理方法以及如…

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

1、内容简介 略 Matlab 169-汽车振动多自由度非线性悬挂系统和参数研究 可以交流、咨询、答疑 2、内容说明 略 第二章 汽车模型建立 2.1 汽车悬架系统概述 2.1.1 悬架系统的结构和功能 2.1.2 悬架分类 2.2 四分之一车辆模型 对于车辆动力学&#xff0c;一般都是研究其悬…

免训练指标(Zero-Cost Proxies)

1. 什么是免训练指标&#xff08;Zero-Cost Proxies&#xff0c;ZC proxies&#xff09;&#xff1f; 免训练指标是一类 无需完整训练模型即可评估其性能的度量方法&#xff0c;主要用于提高 神经架构搜索&#xff08;NAS&#xff09; 的效率。 传统 NAS 需要训练候选架构来评…

C语言 —— 此去经年梦浪荡魂音 - 深入理解指针(卷二)

目录 1. 数组名与地址 2. 指针访问数组 3.一维数组传参本质 4.二级指针 5. 指针数组 6. 指针数组模拟二维数组 1. 数组名与地址 我们先看下面这个代码&#xff1a; int arr[10] { 1,2,3,4,5,6,7,8,9,10 };int* p &arr[0]; 这里我们使用 &arr[0] 的方式拿到了数…

基于Python pyscard库采集ACS ACR122U NFC读卡器数据的详细操作步骤

步骤1&#xff1a;安装驱动 1. 下载驱动&#xff1a; - 访问ACS官网的驱动下载页面&#xff1a;[ACR122U驱动下载](https://www.acs.com.hk/en/drivers/6/acr122u-nfc-reader/)。 - 选择适用于Windows的驱动&#xff08;如 ACR122U Driver (Windows) V3.05.02.zip&#xff09;…