四、函数调用具备单个参数之Double类型-mmword,movsd,mulsd,addsd指令,总结汇编的数据类型

news/2025/10/6 12:58:53/文章来源:https://www.cnblogs.com/tlnshuju/p/19127507

四、函数调用具备单个参数之Double类型-mmword,movsd,mulsd,addsd指令,总结汇编的数据类型

2025-10-06 12:55  tlnshuju  阅读(0)  评论(0)    收藏  举报

一、汇编代码

上一节开始,讲到了很多debug编译独有的汇编方式,为了更好的区分release的编译器优化和debug的区别,从本章节开始将会提供debug和release的汇编用作对比

Debugb编译

single_double_param:  00000000000000A0: F2 0F 11 44 24 08  movsd       mmword ptr [rsp+8],xmm0  00000000000000A6: 57                 push        rdi  00000000000000A7: 48 83 EC 10        sub         rsp,10h  00000000000000AB: 48 8B FC           mov         rdi,rsp  00000000000000AE: B9 04 00 00 00     mov         ecx,4  00000000000000B3: B8 CC CC CC CC     mov         eax,0CCCCCCCCh  00000000000000B8: F3 AB              rep stos    dword ptr [rdi]  00000000000000BA: F2 0F 10 44 24 20  movsd       xmm0,mmword ptr [rsp+20h]  00000000000000C0: F2 0F 59 05 00 00  mulsd       xmm0,mmword ptr [__real@4004000000000000]                    00 00  00000000000000C8: F2 0F 58 05 00 00  addsd       xmm0,mmword ptr [__real@3ff4000000000000]                    00 00  00000000000000D0: 48 83 C4 10        add         rsp,10h  00000000000000D4: 5F                 pop         rdi  00000000000000D5: C3                 ret

Release编译

single_double_param:  0000000000000000: F2 0F 59 05 00 00  mulsd       xmm0,mmword ptr [__real@4004000000000000]                    00 00  0000000000000008: F2 0F 58 05 00 00  addsd       xmm0,mmword ptr [__real@3ff4000000000000]                    00 00  0000000000000010: C3                 ret

二、汇编分析

1. 栈区空间

和浮点类型类似的同样需要申请16个字节的安全空间,使用的方法也是一样的,同时在release编译中也优化掉了这一部分。详细介绍请看上一章节

sub rsp, 10h                    ; 分配16字节栈空间mov rdi, rsp                    ; rdi指向栈顶mov ecx, 4                      ; 循环4次mov eax, 0CCCCCCCCh             ; 初始化值0xCC(调试模式填充)rep stos dword ptr [rdi]        ; 用0xCC填充栈空间(调试用)

2. Double类型在内存空间的表示

在计算机编程中,double类型(双精度浮点数)的内存空间占用和结构遵循IEEE 754标准,无论系统架构(32位或64位)或编译器类型,double类型始终占用 ​​8字节(64位)内存空间​​,这是IEEE 754标准对双精度浮点数的统一规定,与单精度浮点数(float,4字节)和长双精度(long double,通常16字节)形成对比。

double类型的64位内存空间划分为三个部分:

a.符号位(Sign)​​:1位

0表示正数,1表示负数

b. 指数位(Exponent)​​:11位

采用偏移表示法(偏移量1023),实际指数范围为 ​​-1022 到 1023​​,支持表示极大或极小的数值(如±10⁻³⁰⁸ 到 ±10³⁰⁸)

c. 尾数位(Mantissa)​​:52位

存储小数部分,隐含整数位1(规格化数),实际精度为 ​​53位二进制有效数字​​,等效约 ​​15–17位十进制有效数字

这部分的计算方式完全和float类型一致,只是不同类型的位数不同

3. mmword

MMWORD 是 ​​x86/x64 汇编语言​​中的一种数据类型标识符,主要用于处理 ​​64 位多媒体操作数​​,尤其在 MMX(MultiMedia eXtensions)和 SSE(Streaming SIMD Extensions)指令集中。以下是其核心要点:

a. 数据类型标识

  • MMWORD 在汇编中表示一个 ​​64 位(8 字节)的多媒体数据单元​​,与 __m64(C/C++ 中的 MMX 数据类型)等价
  • 用于明确操作数的位宽和语义,避免与普通整型混淆(如 QWORD 虽同为 64 位,但表示无符号整数)

b. 指令操作对象

常见于 MMX/SSE 指令的操作数中,例如:

movq mm0, mmword ptr [ebx]   ; 将内存中 64 位数据加载到 MMX 寄存器 mm0

mmword ptr 修饰内存地址,指明操作数大小为 64 位

拓展:

windows x64汇编中常见的数据单位总结

一、 基础存储单位

单位​位宽​​字节数​​定义​典型应用​
​bit1位1/8字节最小二进制单元(0或1)布尔运算、硬件标志位
Byte6位1字节由8个bit组成,存储基本单元字符编码(ASCII)、内存寻址最小单位
Word​16位2字节早期CPU一次处理的数据长度16位系统整数运算(如8086)
​DWord​32位4字节双字(Double Word),由2个Word组成32位系统整数/指针操作
QWord​64位8字节四字(Quad Word),由4个Word或2个DWord组成64位系统长整型、双精度浮点数

? ​​关键说明​​:

  • ​Word长度可变性​​:在32位系统中,Word可能被定义为32位(如x86架构)
  • ​字节固定性​​:1 Byte恒等于8 bit,不受架构影响

二、 多媒体拓展单位(SIMD指令集专用)

单位​位宽​字节数​​对应指令集​​典型应用​
MMWord​64位8字节MMX早期图像/音频处理(如像素块操作)
XMMWord​128位16字节SSE/AVX向量化浮点运算(如4×32位浮点并行)

? ​​技术演进​​:

  • ​MMWord​​:复用FPU寄存器,操作64位整数
  • ​XMMWord​​:SSE引入独立128位寄存器,支持浮点与整型并行计算

4. 逻辑运算指令

该示例中用到了movsd,mulsd,addsd三种64位的浮点数运算

​指令​​操作数格式​​功能​详细介绍适用场景​
MOVSDxmm_dest, src复制浮点数将 ​​64 位双精度浮点数​​ 从源操作数(内存或 XMM 寄存器)复制到目标操作数(XMM 寄存器)加载/存储浮点数据
MULSDxmm_dest, src浮点数乘法将目标 XMM 寄存器中的双精度浮点数 ​​乘以​​ 源操作数(内存或 XMM 寄存器),结果存回目标寄存器标量乘法运算
ADDSDxmm_dest, src浮点数加法将目标 XMM 寄存器中的双精度浮点数 ​​加上​​ 源操作数(内存或 XMM 寄存器),结果存回目标寄存器标量加法运算

三、 汇编转化

movsd mmword ptr [rsp+8], xmm0  ; 将浮点参数保存到栈[rsp+8]push rdi                        ; 保存rdi寄存器(被调用者保存)sub rsp, 10h                    ; 分配16字节栈空间mov rdi, rsp                    ; rdi指向栈顶mov ecx, 4                      ; 循环4次mov eax, 0CCCCCCCCh             ; 初始化值0xCC(调试模式填充)rep stos dword ptr [rdi]        ; 用0xCC填充栈空间(调试用)movsd xmm0, mmword ptr [rsp+20h]  ; 从栈[rsp+0x20]加载参数到xmm0mulsd xmm0, mmword ptr [__real@4004000000000000]  ; 乘以常量2.5(0x400400...)addsd xmm0, mmword ptr [__real@3ff4000000000000]  ; 加上常量1.25(0x3ff400...)

转化成C语言

double single_double_param(double param) {    // 调试模式下的栈初始化(对应 rep stos 指令),release则会优化掉这部分    volatile char debug_fill[16]; // 0xCC填充的栈空间     // 核心计算逻辑(对应 mulsd/addsd)    return param * 2.5 + 1.25;}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/929337.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

商丘网站建设的公司哪家好企业所得税什么时候交

#include指令和头文件 例如#include <stdio.h>&#xff0c;我们经常看到C文件最上面会有类似这样的语句&#xff0c;它的作用相当于把stdio.h文件中的所有内容都输入该行所在的位置。实际上&#xff0c;这是一种“拷贝-粘贴”的操作。 #include这行代码是一条C预处理器…

深圳网站建设 利科技有限公司购物网站建设服务

如果对于二叉搜索树不是太清楚&#xff0c;为什么要使用二叉搜索树&#xff1f;作者推荐&#xff1a;二叉搜索树的初步认识_加瓦不加班的博客-CSDN博客 定义节点 static class BSTNode {int key; // 若希望任意类型作为 key, 则后续可以将其设计为 Comparable 接口Object val…

[GDOUCTF 2023]泄露的伪装

打开题目,根据题目提示扫描题目所在目录扫描完成后访问扫描到的两个文件 在压缩包文件中看到php文件直接访问php文件后,看到源码使用写入协议 ?cxk=data://text/plain;base64,Y3RybA==得到flag

仿射密码

前言 在密码学的发展历程中,从简单的凯撒密码到更具安全性的加密方式,仿射密码是重要的进阶。它基于数论知识,通过线性变换为信息加密,既保留了替换加密的简洁,又大幅提升了保密性,是理解现代加密算法的关键基础…

写作网站有哪些深圳建设工程交易平台

阻塞I/O Socket设置为阻塞模式&#xff0c;当socket不能立即完成I/O操作时&#xff0c;进程或线程进入等待状态&#xff0c;直到操作完成。如下图&#xff1a; 这种模型非常经典&#xff0c;也被广泛使用&#xff0c;优势在于非常简单&#xff0c;等待的过程中占用的系统资源微…

网站建设从入门pdfwordpress文章出问题

什么是二进制&#xff1f; 数字电路 中 只有 高电平 和低电平 就是 1 和0 进位规则是“逢二进一”&#xff0c;借位规则是“借一当二”。 二进制、八进制 、十进制、十六进制 二进制 有两个数来表示 &#xff1a; 0、1 八进制 有8个数来表示 &#xff1a; 0、1、2、3、4、…

压铸东莞网站建设中国站长之家

结合单元测试框架pytest数据驱动模型allure 目录 api&#xff1a; 存储测试接口 conftest.py :设置前置操作 目前前置操作&#xff1a;1、获取token并传入headers&#xff0c;2、获取命令行参数给到环境变量,指定运行环境 commmon&#xff1a;存储封装的公共方法 connect_mysq…

AtCoder Regular Contest 207 (Div.1) 游记

赛时一个半小时没出题,赛后再来三个小时终于搞出 A。省流 赛时一个半小时没出题,赛后再来三个小时终于搞出 A。10.5 内含剧透,请vp后再来。 不是题解!!!!!!! 赛前 本来发现要补的东西还剩很多,结果当天上午…

kubeadm续约k8s 1.23.14所有证书

[root@zy-nph-skg-fat-k8s-master01 kubernetes-1.23.14-0]# kubeadm certs renew all [renew] Reading configuration from the cluster... [renew] FYI: You can look at this config file with kubectl -n kube-sys…

Linux或者Windows下PHP版本查看便捷的方法总结

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

详细介绍:云原生时代 Kafka 深度实践:05性能调优与场景实战

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

深入解析:AI破局:饿了么如何搅动即时零售江湖

深入解析:AI破局:饿了么如何搅动即时零售江湖pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", &…

从零开始学Flink:数据输出的终极指南

本文详细介绍了Flink数据输出(Sink)的核心概念、各种连接器的使用方法、配置选项及可靠性保证机制。基于Flink 1.20.1的DataStream API,通过丰富的代码示例展示了如何将处理后的数据输出到Kafka、Elasticsearch、文件…

asp 企业网站dw制作一个手机网站模板下载地址

初识RPC RPC VS REST HTTP Dubbo Dubbo 特性&#xff1a; 基于接口动态代理的远程方法调用 Dubbo对开发者屏蔽了底层的调用细节&#xff0c;在实际代码中调用远程服务就像调用一个本地接口类一样方便。这个功能和Fegin很类似&#xff0c;但是Dubbo用起来比Fegin还要简单很多&a…

六盘水网站建设求职简历杭州公司网站建设套餐

FPGA-结合协议时序实现UART收发器&#xff08;四&#xff09;&#xff1a;串口驱动模块uart_drive、例化uart_rx、uart_tx 串口驱动模块uart_drive、例化uart_rx、uart_tx&#xff0c;功能实现 文章目录 FPGA-结合协议时序实现UART收发器&#xff08;四&#xff09;&#xff1…

数据编织平台实现AI代理自助数据访问

数据管理初创公司发布即时数据编织平台重大更新,支持AI代理自助数据访问。平台采用自然语言处理与自动化数据准备技术,无需ETL流程即可跨数百个数据源提供统一访问,并配备上下文引擎和对话式AI助手。数据编织初创公…

高水平的锦州网站建设厦门网站设计大概多少钱

目录 一、简介 二、BeanFactory 三、FactoryBean 四、区别 五、使用场景 总结 一、简介 在Spring框架中&#xff0c;IOC&#xff08;Inversion of Control&#xff09;容器是一个核心组件&#xff0c;它负责管理和配置Java对象及其依赖关系&#xff0c;实现了控制反转&a…

广州设计公司网站磁县邯郸网站建设

是将若干个学习器(分类器&回归器)组合之后产生一个新学习器。弱分类器(weak learner)指那些分类准确率只稍微好于随机猜测的分类器(errorrate <。 集成算法的成功在于保证弱分类器的多样性(Diversity)。而且集成不稳定的算法也能够得到一个比较明显的性能提升。 常见的…

[题解]P12008 【MX-X10-T4】[LSOT-4] Fragment of Memories

P12008 【MX-X10-T4】[LSOT-4] Fragment of Memories 可以想到很 naive 的思路,对于每个 \(x\) 值二分答案 \(m\)。check 函数可以 \(O(n)\) 完成。总时间是 \(O(n^2\log n)\) 的。我们发现 check 函数明显还能凹,考…

自然语言处理(NLP)的系统学习路径规划 - 实践

自然语言处理(NLP)的系统学习路径规划 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", &…