在MCU工程中优化CPU工作效率的几种方法

在嵌入式系统开发中,优化 CPU 工作效率对于提升系统性能、降低功耗、提高实时性至关重要。Keil 作为主流的嵌入式开发工具,提供了多种优化策略,包括 关键字使用、内存管理、字节对齐、算法优化 等。本文将从多个方面介绍如何在 Keil 工程中优化 CPU 运行效率。

一、关键字优化

1. 使用 static 关键字

  • 减少栈操作:static 变量存放在 静态存储区,避免函数调用时频繁创建和销毁局部变量,减少 CPU 访问栈的开销。

  • 优化函数调用:static 限定函数作用域,编译器可以优化调用方式,如内联优化或删除未使用的函数。

示例:

static int counter = 0;  // 避免频繁创建局部变量,提升性能

2. 使用 inline 关键字

  • 减少函数调用开销:对于小的、频繁调用的函数,使用 inline 让编译器展开函数,减少栈操作,提高执行效率。

示例:

inline int add(int a, int b) {return a + b;  // 直接展开,提高性能
}

3. 使用 const 关键字

  • 优化编译器优化空间:const 变量不会被修改,编译器可将其优化为常量表达式,减少 RAM 访问,提高指令执行效率。

  • 避免全局变量占用 RAM:const 变量通常存储在 Flash(只读存储区),减少 RAM 使用,提高运行效率。

示例:

const uint32_t baud_rate = 115200;  // 存放在 Flash 中,减少 RAM 占用

4. 使用 volatile 关键字

  • 防止编译器优化:适用于 寄存器变量、外设寄存器、共享变量,避免编译器优化导致的错误,确保每次都从实际地址读取值。

  • 适用于中断变量、硬件寄存器访问等场景。

示例:

volatile uint8_t flag = 0;  // 确保每次读取的值都是最新的

二、字节对齐(结构体优化)

嵌入式系统中,结构体成员若未对齐,CPU 可能需要额外的 总线周期 读取数据,从而降低效率。

1. 使用 attribute((aligned(n))) 或 #pragma pack(n)

#pragma pack(4)  // 4字节对齐
typedef struct {uint32_t id;uint16_t value;uint8_t flag;
} __attribute__((aligned(4))) my_struct_t;
#pragma pack()
  • 尽量让结构体成员按 32-bit (4字节) 对齐,提高访问效率。

  • 结构体字段按照 uint32_t -> uint16_t -> uint8_t 顺序排列,避免填充字节,减少存储空间浪费。

三、内存管理优化

1. 减少堆(heap)使用

  • malloc/free 开销大,容易导致碎片化,应避免在 实时任务 或 中断 中使用。

  • 优先使用静态内存 (static 变量) 代替堆内存分配,提高执行效率。

2. 使用 DMA(直接存储访问)

  • 减少 CPU 负担,使用 DMA 传输数据(如 UART、SPI、I2C),CPU 仅需触发 DMA 传输,不用参与整个数据搬运过程。

  • 适用于大数据量传输场景,如传感器数据读取、LCD 屏幕刷新等。

四、指令优化(算法层面)

1. 使用位运算代替乘除法

>> 代替除法,<< 代替乘法,减少 CPU 指令执行时间。

int x = a * 8;   // 慢
int y = a << 3;  // 快

2. 使用查表法

预计算常用值 存入查找表(LUT),避免实时计算,如 sin() 和 cos()。

const uint8_t sine_table[256] = { /* 预计算数据 */ };
uint8_t value = sine_table[angle];  // 直接查表,提高效率

3. 使用循环展开

for (int i = 0; i < 4; i++) {sum += arr[i];  // 常规循环
}// 进行循环展开
sum = arr[0] + arr[1] + arr[2] + arr[3];  // 提高 CPU 指令并行度

4. 减少浮点运算

  • 浮点运算 (float) 比整数运算 (int) 慢,尽量使用整数计算。

  • 使用 fixed-point 计算替代浮点计算(如 Q31、Q15 格式)。

五、其他优化措施

1. 使用 O3 级别优化

  • Keil 提供 优化选项 O0 ~ O3,O3 优化级别最高,可自动优化代码执行效率,但可能影响调试。

  • O2 适用于大多数场景,O3 适用于对性能要求极高的任务。

2. 优化中断

  • 减少 ISR 执行时间,避免在中断中执行复杂运算。

  • 使用 __attribute__((interrupt)) 声明中断函数,优化编译器生成的中断代码。

3. 使用 CMSIS 和 ARM DSP 库

  • ARM 提供的 CMSIS-DSP 和 CMSIS-NN 库 对 Cortex-M 内核进行了优化,加速数学运算。

  • 例如,使用 arm_math.h 中的 arm_sqrt_f32() 计算平方根,比 sqrt() 更快。


总结

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/899597.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux系统下C语言fork函数使用案例

一、fork函数的作用 生成一个子进程&#xff0c;异步执行某个任务&#xff1b; 二、子进程的作用 1、子进程能复制一份父进程的变量、函数&#xff1b; 2、子进程可以和父进程同时并发执行&#xff1b; 函数语法&#xff1a; pid_t fork() 说明&#xff1a;调用后返回一个进程…

MySQL中的CREATE TABLE LIKE和CREATE TABLE SELECT

MySQL中的CREATE TABLE LIKE和CREATE TABLE SELECT CREATE TABLE LIKECREATE TABLE SELECT CREATE TABLE LIKE CREATE TABLE ... LIKE可以用来复制表结构&#xff0c;源表上的索引和约束也会复制。CREATE TABLE ... LIKE不能复制表数据。CREATE TABLE ... LIKE只能复制基表&…

Java开发者指南:深入理解HotStuff新型共识算法

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家、全栈领域优质创作者、高级开发工程师、高级信息系统项目管理师、系统架构师&#xff0c;数学与应用数学专业&#xff0c;10年以上多种混合语言开发经验&#xff0c;从事DICOM医学影像开发领域多年&#xff0c;熟悉DICOM协议及…

opencv图像处理之指纹验证

一、简介 在当今数字化时代&#xff0c;生物识别技术作为一种安全、便捷的身份验证方式&#xff0c;正广泛应用于各个领域。指纹识别作为生物识别技术中的佼佼者&#xff0c;因其独特性和稳定性&#xff0c;成为了众多应用场景的首选。今天&#xff0c;我们就来深入探讨如何利…

wfs.js之h264转码mp4分析

准备源文件 下载源文件 git clone https://github.com/ChihChengYang/wfs.js.git编译后得到wfs.js这个文件 调用 在demo/index.html中&#xff0c;前端对wfs.js进行了调用 var video1 document.getElementById("video1"), wfs new Wfs(); wfs.attachMedia…

协程 Coroutine

协程是 C20 引入的新特性。 文章目录 基本概念std::coroutine_handlepromise 类型co_yield 基本用法 优势异步 TCPco_await 基本概念 协程&#xff08;Coroutine&#xff09;是一种比线程更加轻量级的并发编程模型。协程的调度由程序员手动控制。 异步不是并行&#xff0c;但…

uniapp中的流式输出

一、完整代码展示 目前大多数的ai对话都是流式输出&#xff0c;也就是对话是一个字或者多个字逐一进行显示的下面是一个完整的流式显示程序&#xff0c;包含的用户的消息发出和ai的消息回复 <template><view class"chat-container"><view class&quo…

洛谷题单1-P5703 【深基2.例5】苹果采购-python-流程图重构

题目描述 现在需要采购一些苹果&#xff0c;每名同学都可以分到固定数量的苹果&#xff0c;并且已经知道了同学的数量&#xff0c;请问需要采购多少个苹果&#xff1f; 输入格式 输入两个不超过 1 0 9 10^9 109 正整数&#xff0c;分别表示每人分到的数量和同学的人数。 输…

JS 手撕题高频考点

前端面试中&#xff0c;JS 手撕题是高频考点&#xff0c;主要考察 编程能力、算法思维、JS 核心知识。以下是最常见的手撕题分类 代码示例&#xff1a; 目录 &#x1f4cc; 1. 手写函数柯里化&#x1f4cc; 2. 手写 debounce&#xff08;防抖&#xff09;&#x1f4cc; 3. 手写…

【STM32】知识点介绍一:硬件知识

文章目录 一、电源引脚简介二、电平信号三、电路分析 一、电源引脚简介 VCC、GND、VDD和VSS是电子电路中常见的术语&#xff0c;代表着不同的电源引脚或电压。 VCC&#xff08;Voltage at the Common Collector&#xff09;&#xff1a;VCC是指集电极&#xff08;Collector&am…

3. 列表元素替换

【问题描述】给定一个列表&#xff0c;将列表中所有的偶数替换为0 【输入形式】输入一行&#xff0c;包含若干个整数&#xff0c;用空格分隔 【输出形式】输出替换后的列表&#xff0c;每个元素用空格分隔 【样例输入】1 2 3 4 5 6 7 8 9 10 【样例输出】1 0 3 0 5 0 7 0 9…

问题的根源还是解题的方案

周末的早上照例是要早醒 debug 代码的&#xff0c;仿佛又回到了 2014 年… 古人几天甚至几个月不洗澡&#xff0c;不会臭吗&#xff1f;有没有可能古人没有化纤类衣服&#xff0c;且古人的纯天然生活环境其身体菌群和现代人不同&#xff0c;古人就像健康的野生动物一样即使不洗…

虚拟机安装linux系统无法上网的解决方法

在虚拟环境中运行Linux系统时&#xff0c;有时会遇到网络连接问题&#xff0c;特别是在使用虚拟机软件如VMware或VirtualBox时。本文将详细介绍一种针对“虚拟机安装Linux系统无法上网”问题的解决方案&#xff0c;以CentOS 6.5为例&#xff0c;适用于其他基于NAT模式的虚拟机环…

子网划分浅度解析

文章目录 ip地址的组成不同类型ip地址的范围子网掩码默认子网掩码子网掩码如何作用的&#xff1f;默认子网掩码怎么作用&#xff1f; ip地址的组成 ip地址一般写作4位点分十进制&#xff08;x.x.x.x&#xff09;&#xff0c;他们由32位二进制组成&#xff0c;每个x由8位二进制…

什么是 SEO(搜索引擎优化)?

您有网站吗&#xff0c;或者您正在考虑创建一个网站&#xff1f;您想吸引更多人加入您的业务吗&#xff1f;如果答案是肯定的&#xff0c;那么毫无疑问&#xff1a;SEO 应该是您营销工作的一部分。这是建立品牌和吸引用户访问您的网站的好方法。但它实际上意味着什么呢&#xf…

鸿蒙HarmonyOS NEXT设备升级应用数据迁移流程

数据迁移是什么 什么是数据迁移&#xff0c;对用户来讲就是本地数据的迁移&#xff0c;终端设备从HarmonyOS 3.1 Release API 9及之前版本&#xff08;单框架&#xff09;迁移到HarmonyOS NEXT&#xff08;双框架&#xff09;后保证本地数据不丢失。例如&#xff0c;我在某APP…

【现代深度学习技术】现代卷积神经网络04:含并行连接的网络(GoogLeNet)

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上&#xff0c;结合当代大数据和大算力的发展而发展出来的。深度学习最重…

【ESP32】ESP32与MQTT通信:实现传感器数据监测与设备控制

ESP32与MQTT通信 1 项目概览2 硬件组成3 MQTT协议解析MQTT协议简介MQTT核心概念本项目中的MQTT应用 4 MQTT Broker选择EMQX Broker其他常用MQTT Broker 5 代码解析初始化与配置MQTT消息处理发布传感器数据 6 MQTT话题TOPIC设计7 EMQX的优势在IoT项目中的体现8 MQTT通信流程9 应…

[特殊字符]《Curve DAO 系统学习目录》

本教程旨在系统学习 Curve DAO 项目的整体架构、核心机制、合约设计、治理逻辑与代币经济等内容&#xff0c;帮助开发者全面理解其设计理念及运作方式。 目录总览&#xff1a; 1. Curve 项目概览 • 1.1 Curve 是什么&#xff1f;主要解决什么问题&#xff1f; • 1.2 与其他…

每天一篇目标检测文献(六)——Part One

今天看的是《Object Detection with Deep Learning: A Review》 目录 一、摘要 1.1 原文 1.2 翻译 二、介绍 2.1 信息区域选择 2.2 特征提取 2.3 分类 三、深度学习的简要回顾 3.1 历史、诞生、衰落和繁荣 3.2 CNN架构和优势 一、摘要 1.1 原文 Due to object dete…