第十三章:优化内存管理_《C++性能优化指南》_notes

优化内存管理

      • 一、内存管理基础概念
      • 二、自定义分配器
      • 三、智能指针优化
        • 重点知识
        • 代码示例:智能指针性能对比
      • 四、性能优化关键点总结
      • 多选题
      • 设计题
      • 答案与详解
        • 多选题答案
        • 设计题示例答案(第1题)


一、内存管理基础概念

重点知识

  1. 动态内存分配开销
    • newdelete涉及系统调用,频繁操作会导致性能瓶颈
    • 内存碎片化会降低内存利用率
  2. 自定义内存管理
    • 预分配内存块(内存池)
    • 类专属内存管理器
    • 自定义分配器

代码示例:类专属内存管理器

#include <iostream>
#include <vector>class MemoryPool {
public:static void* Allocate(size_t size) {if (!freeList.empty()) {void* ptr = freeList.back();freeList.pop_back();return ptr;} else {return ::operator new(size); // 系统默认分配}}static void Deallocate(void* ptr, size_t size) {freeList.push_back(ptr);}private:static std::vector<void*> freeList;
};std::vector<void*> MemoryPool::freeList;class MyObject {
public:void* operator new(size_t size) {return MemoryPool::Allocate(size);}void operator delete(void* ptr, size_t size) {MemoryPool::Deallocate(ptr, size);}MyObject(int val) : data(val) {}int getData() const { return data; }private:int data;
};int main() {// 测试内存池MyObject* obj1 = new MyObject(10);MyObject* obj2 = new MyObject(20);std::cout << "obj1 data: " << obj1->getData() << std::endl;std::cout << "obj2 data: " << obj2->getData() << std::endl;delete obj1;delete obj2;// 验证内存回收后重用MyObject* obj3 = new MyObject(30);std::cout << "obj3 data: " << obj3->getData() << std::endl;delete obj3;return 0;
}

代码解析:

  • MemoryPool管理空闲内存块,Allocate优先使用空闲列表
  • MyObject重载newdelete,使用自定义内存池
  • main函数测试内存分配、释放和重用

编译运行:

g++ -std=c++11 mem_pool.cpp -o mem_pool && ./mem_pool

二、自定义分配器

重点知识

  1. STL容器默认分配器性能问题
    • 频繁小内存分配效率低
  2. 实现自定义分配器
    • 必须提供allocatedeallocate等方法
    • 需要处理类型定义和模板参数

代码示例:固定大小内存分配器

#include <iostream>
#include <vector>
#include <memory>template <typename T>
class FixedAllocator {
public:using value_type = T;FixedAllocator() = default;template <typename U>FixedAllocator(const FixedAllocator<U>&) {}T* allocate(size_t n) {if (n != 1) {throw std::bad_alloc(); // 仅支持单对象分配}return static_cast<T*>(::operator new(sizeof(T)));}void deallocate(T* p, size_t n) {::operator delete(p);}
};// 允许不同模板实例间的转换
template <typename T, typename U>
bool operator==(const FixedAllocator<T>&, const FixedAllocator<U>&) {return true;
}int main() {std::vector<int, FixedAllocator<int>> vec;for (int i = 0; i < 5; ++i) {vec.push_back(i);}std::cout << "Vector elements: ";for (auto v : vec) {std::cout << v << " ";}std::cout << std::endl;return 0;
}

代码解析:

  • FixedAllocator实现固定大小的内存分配
  • std::vector结合使用,减少内存分配次数
  • main测试自定义分配器的容器使用

编译运行:

g++ -std=c++11 custom_allocator.cpp -o custom_allocator && ./custom_allocator

三、智能指针优化

重点知识
  1. std::make_shared vs new
    • make_shared合并控制块和对象内存,提升局部性
  2. 避免循环引用
    • 使用weak_ptr打破循环
代码示例:智能指针性能对比
#include <iostream>
#include <memory>
#include <chrono>class HeavyObject {
public:HeavyObject() { data = new int[1000]; }~HeavyObject() { delete[] data; }
private:int* data;
};void test_make_shared() {auto start = std::chrono::high_resolution_clock::now();for (int i = 0; i < 10000; ++i) {auto p = std::make_shared<HeavyObject>();}auto end = std::chrono::high_resolution_clock::now();std::cout << "make_shared time: " << std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count()<< " ms\n";
}void test_new_shared() {auto start = std::chrono::high_resolution_clock::now();for (int i = 0; i < 10000; ++i) {auto p = std::shared_ptr<HeavyObject>(new HeavyObject);}auto end = std::chrono::high_resolution_clock::now();std::cout << "new+shared_ptr time: "<< std::chrono::duration_cast<std::chrono::milliseconds>(end - start).count()<< " ms\n";
}int main() {test_make_shared();test_new_shared();return 0;
}

代码解析:

  • 对比make_shared和直接new的性能差异
  • HeavyObject模拟大对象分配
  • 使用高精度计时器测量执行时间

编译运行:

g++ -std=c++11 smart_ptr.cpp -o smart_ptr && ./smart_ptr

四、性能优化关键点总结

  1. 减少系统调用
    • 预分配内存池
    • 批量分配代替单次分配
  2. 提高缓存命中率
    • 对象连续存储(如std::vector
    • 使用make_shared合并内存块
  3. 线程安全考虑
    • 多线程环境需加锁(示例未展示,但实际项目需注意)
  4. 自定义分配器适用场景
    • 频繁小对象分配
    • 特定大小的对象分配

核心知识点总结:

  1. C++内存管理API(new/delete, operator new/delete)
  2. 自定义内存分配器的设计与实现
  3. 类专用内存管理器(per-class allocator)
  4. 内存池技术(memory pool)
  5. 智能指针与所有权管理
  6. 移动语义与右值引用优化
  7. 内存对齐与缓存优化
  8. 内存碎片管理策略
  9. 多线程环境下的内存管理
  10. 标准库容器内存分配策略

多选题

  1. 关于C++内存管理API,哪些说法正确?
    A. operator new可以重载实现自定义内存分配策略
    B. delete表达式会自动调用析构函数并释放内存
    C. placement new不会分配内存,只在已分配内存上构造对象
    D. ::operator new(size_t)会触发构造函数调用

  2. 以下哪些方法可以有效减少动态内存分配?
    A. 使用std::make_shared替代new
    B. 预分配内存并复用内存块
    C. 使用std::vector的reserve方法
    D. 优先使用栈分配对象

  3. 关于类专用内存管理器,正确的是:
    A. 需要重载类的operator new和operator delete
    B. 可以避免内存碎片问题
    C. 适用于频繁创建销毁的小对象
    D. 必须使用单例模式实现

  4. 选择内存池技术的主要优势包括:
    A. 减少内存分配/释放的系统调用开销
    B. 提高缓存局部性
    C. 完全消除内存泄漏风险
    D. 支持任意大小的内存分配

  5. 关于std::allocator,正确的是:
    A. 可以通过rebind模板适配不同类型
    B. 分配的内存总是按字节对齐
    C. 默认实现使用malloc/free
    D. 可以完全避免内存碎片

  6. 移动语义对内存管理的优化体现在:
    A. 避免不必要的深拷贝
    B. 允许资源所有权的转移
    C. 完全替代拷贝构造函数
    D. 只能在模板元编程中使用

  7. 多线程环境下内存管理需要注意:
    A. 使用线程局部存储(TLS)分配器
    B. 避免虚假共享(false sharing)
    C. 必须使用锁保护所有分配操作
    D. 优先使用无锁数据结构

  8. 关于内存对齐优化,正确的是:
    A. alignas关键字可以指定对象对齐方式
    B. SIMD指令需要特殊内存对齐
    C. 错误对齐会导致性能下降
    D. 所有平台默认对齐方式相同

  9. 智能指针的内存管理策略包括:
    A. std::shared_ptr使用引用计数
    B. std::unique_ptr支持拷贝语义
    C. std::weak_ptr用于打破循环引用
    D. make_shared比直接new更高效

  10. 减少内存复制的有效方法有:
    A. 使用移动构造函数
    B. 实现写时复制(COW)
    C. 优先传递const引用
    D. 所有返回对象都使用RVO


设计题

  1. 实现固定大小内存池

    // 要求:
    // 1. 支持固定大小的内存块分配
    // 2. 内存池预分配大块内存管理
    // 3. 线程安全
    // 4. 提供性能对比测试
    
  2. 优化std::list的内存分配

    // 要求:
    // 1. 为std::list设计专用分配器
    // 2. 每次批量分配多个节点内存
    // 3. 支持动态调整批量大小
    // 4. 验证内存使用效率提升
    
  3. 无锁内存分配器设计

    // 要求:
    // 1. 实现基于原子操作的内存分配
    // 2. 支持多线程并发分配
    // 3. 避免使用mutex锁
    // 4. 测试并发性能指标
    
  4. 对象池模板实现

    // 要求:
    // 1. 模板化设计支持任意类型
    // 2. 对象复用避免重复构造
    // 3. 自动回收机制
    // 4. 测试对象创建性能提升
    
  5. 智能指针自定义删除器优化

    // 要求:
    // 1. 实现内存池绑定的删除器
    // 2. 与std::unique_ptr集成
    // 3. 支持不同内存池实例
    // 4. 验证内存回收正确性
    

答案与详解

多选题答案
  1. ABC
    D错误:operator new只分配内存,不调用构造函数

  2. ABCD
    所有选项均为有效减少动态分配的方法

  3. ABC
    D错误:单例模式不是必须的

  4. AB
    C错误:不能完全消除泄漏;D错误:固定大小

  5. AC
    B错误:对齐由实现决定;D错误:仍可能产生碎片

  6. AB
    C错误:不能完全替代;D错误:通用特性

  7. ABD
    C错误:无锁设计不需要锁

  8. ABC
    D错误:不同平台对齐要求不同

  9. ACD
    B错误:unique_ptr不可拷贝

  10. ABCD
    所有选项均为有效方法


设计题示例答案(第1题)

固定大小内存池实现

#include <iostream>
#include <vector>
#include <memory>
#include <chrono>template <size_t BlockSize>
class FixedMemoryPool {struct Block {char data[BlockSize];Block* next;};Block* freeList = nullptr;std::vector<std::unique_ptr<char[]>> chunks;public:void* allocate() {if (!freeList) {const size_t chunk_size = 1024;auto chunk = std::make_unique<char[]>(chunk_size * BlockSize);chunks.push_back(std::move(chunk));for (size_t i = 0; i < chunk_size; ++i) {Block* blk = reinterpret_cast<Block*>(chunks.back().get() + i * BlockSize);blk->next = freeList;freeList = blk;}}void* result = freeList;freeList = freeList->next;return result;}void deallocate(void* ptr) {Block* blk = static_cast<Block*>(ptr);blk->next = freeList;freeList = blk;}
};struct MyObject {int data[128];
};void test_performance() {const int iterations = 100000;// 测试标准分配auto start_std = std::chrono::high_resolution_clock::now();for (int i = 0; i < iterations; ++i) {auto ptr = new MyObject;delete ptr;}auto end_std = std::chrono::high_resolution_clock::now();// 测试内存池FixedMemoryPool<sizeof(MyObject)> pool;auto start_pool = std::chrono::high_resolution_clock::now();for (int i = 0; i < iterations; ++i) {auto ptr = pool.allocate();pool.deallocate(ptr);}auto end_pool = std::chrono::high_resolution_clock::now();auto std_time = std::chrono::duration_cast<std::chrono::microseconds>(end_std - start_std).count();auto pool_time = std::chrono::duration_cast<std::chrono::microseconds>(end_pool - start_pool).count();std::cout << "Standard alloc: " << std_time << "μs\n"<< "Pool alloc:     " << pool_time << "μs\n"<< "Performance ratio: " << static_cast<double>(std_time)/pool_time << "x\n";
}int main() {test_performance();return 0;
}

测试结果示例:

Standard alloc: 5432μs
Pool alloc:     127μs
Performance ratio: 42.75x

实现要点:

  1. 使用链表管理空闲块
  2. 批量预分配内存块(chunk)
  3. 分配/释放操作O(1)时间复杂度
  4. 线程安全需要额外加锁(示例未包含)
  5. 显著提升小对象分配性能

其他设计题目的答案, 稍后补充
其他设计题需要类似的结构,针对特定问题设计解决方案,并通过性能测试验证优化效果。每个实现应包含:

  • 核心数据结构和算法
  • 内存管理策略
  • 线程安全机制(如果需要)
  • 性能测试对比
  • 正确性验证测试

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73994.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python笔记之函数

函数初探 python在要写出函数很简单&#xff0c;通过关键字def即可写出&#xff0c;简单示例如下 def add(a, b):return ab 以上即可以定义出一个简单的函数&#xff1a;接收两个变量a和b&#xff0c;返回a和b相加的结果&#xff0c;当然这么说也不全对&#xff0c;原因就是…

【服务器操作指南 - GPU 使用与文件传输】轻松掌握 GPU 状态查看和服务器文件传输技巧

0. 引言 在使用服务器时&#xff0c;高效管理 GPU 和文件传输是两项不可或缺的技能。 本指南旨在帮助您快速掌握服务器环境下的 GPU 使用状态监测方法&#xff0c;并简要介绍如何在服务器之间进行文件传输操作。 1. 查看服务器上的 gpu 使用状态 1.1 安装 gpustat 这条指令…

0330-YYYY-MM-DD格式日期比较大小

最简单的&#xff08;python&#xff09; from datetime import datetime def compare_time(time1,time2): time1_t datetime.strptime(time1,“%Y-%m-%d”) time2_t datetime.strptime(time2,“%Y-%m-%d”) if time1_t < time2_t: return time1_t elif time1_t > ti…

QFlightInstruments飞行仪表控件库

QFlightInstruments 是一个开源的飞行仪表控件库&#xff0c;专为基于 Qt 的应用程序设计。它提供了一系列仿真实飞机仪表的组件&#xff0c;适用于飞行模拟软件、航空电子系统或任何需要高仿真飞行仪表显示的项目。 主要功能 高仿真飞行仪表&#xff1a;包括空速表、高度表、…

VSCode 市场发现恶意扩展正在传播勒索软件!

在VSCode 市场中发现了两个隐藏着勒索软件的恶意扩展。其中一个于去年 10 月出现在微软商店&#xff0c;但很长时间没有引起注意。 这些是扩展ahban.shiba 和 ahban.cychelloworld&#xff0c;目前已从商店中删除。 此外&#xff0c;ahban.cychelloworld 扩展于 2024 年 10 月…

国信华源携AI+水利创新成果亮相第十五届防汛抗旱信息化技术交流会

直击展会现场 近日&#xff0c;以“人工智能赋能防汛抗旱 融合创新共御极端灾害”为主题的第十五届防汛抗旱信息化技术交流会在河南郑州召开。作为水旱灾害防御领域的专精企业&#xff0c;北京国信华源科技有限公司携自主研发的入户叫应预警系统及覆盖防汛抗旱全链条的智慧化场…

MATLAB语言的链表反转

MATLAB语言的链表反转 链表是一种常见的数据结构&#xff0c;与数组相比&#xff0c;链表在插入和删除操作方面具有更高的灵活性。然而&#xff0c;链表的一些操作&#xff0c;比如反转链表&#xff0c;对一些初学者来说可能是一个挑战。本篇文章将重点讨论如何使用MATLAB语言…

Oracle数据库数据编程SQL<2.2 DDL 视图、序列>

目录 一、Oracle 视图(Views) &#xff08;一&#xff09; Oracle 视图特点 &#xff08;二&#xff09;Oracle 视图创建语法 关键参数&#xff1a; &#xff08;三&#xff09;Oracle 视图类型 1、普通视图 2、连接视图&#xff08;可更新&#xff09; 3、对象视图 4…

QtAdvancedStylesheets使用

QtAdvancedStylesheets 是一个基于 Qt Widgets 的样式表(QSS)增强库,允许开发者通过类似 CSS 的方式深度定制 Qt 应用程序的界面风格,支持动态主题切换、动画效果和复杂控件样式设计。 1. 核心功能 高级样式表支持 使用 CSS-like 语法美化 Qt Widgets(如 QPushButton、Q…

QtAV入门

QtAV 是一个基于 FFmpeg 和 Qt 的高性能多媒体播放框架,提供强大的音视频解码、渲染和处理能力,适合开发跨平台的播放器、视频编辑和流媒体应用。 1. 核心功能 多格式支持 支持 H.264/H.265、VP9、AV1 等视频编码。 支持 MP3、AAC、Opus 等音频编码。 封装格式:MP4、MKV、…

[ C++ ] | C++11 从左值引用到右值引用

&#xff08;目录占位&#xff09; 1. 前言&#xff1a; C 11 是在 C 98 之后又一个变化比较大的标准。为C增加了很多东西&#xff0c;其中有一部分是有用的&#xff0c;有一部分是我自认为作用不是很大东西。这一章呢&#xff1f;我们就来说说C11我&#xff0c;我认为对性能…

基于MCU实现的电机转速精确控制方案:软件设计与实现

本文将详细介绍一篇基于微控制器&#xff08;MCU&#xff09;的电机转速精确控制的软件方案。通过采样PWM信号控制和ADC采样技术&#xff0c;结合PID闭环控制算法&#xff0c;实现了电机转速的高效、稳定调节。以下是软件方案流程图&#xff0c;下文将对其进行展开讲解。 原图太…

Jmeter触发脚本备份

JMeter 在以下情况会触发脚本备份&#xff1a; 手动保存测试计划时&#xff1a;如果测试计划有未保存的修改&#xff0c;当用户手动保存测试计划&#xff08;脚本&#xff09;时&#xff0c;JMeter 都会自动将当前脚本备份到${JMETER_HOME}/backups文件夹下。 关闭 JMeter 时…

AI人工智能-PyCharm的介绍安装应用

下载与安装 创建python项目 项目路径&#xff1a;C:\Users\miloq\Desktop\python_project 配置环境 提前找到conda配置的python-base路径 配置conda环境 运行项目 运行结果

Flink内存模型--flink1.19.1

Flink 的 JobManager 和 TaskManager 在内存分配上有不同的职责和结构。以下是两者的内存分类及详细说明&#xff1a; 一、JobManager 内存分类 JobManager 主要负责作业调度、协调&#xff08;如 Checkpoint 协调&#xff09;、资源管理等&#xff0c;其内存需求相对较低&…

华为数字化转型-方法篇

1 方法篇-3-愿景驱动的数字化转型规划 1.2 业务战略是数字化转型的龙头 1.3 数字时代&#xff0c;企业需要适时地调整业务战略 1.3.1 引入数字化商业模式 引入数字化商业模式包括改变与客户做生意的方式&#xff0c;改变销售的渠道&#xff0c;基于产业互联网重新定位与行 业…

常用的排序算法------练习4

1. 题目 2. 思路和题解 这道题是很经典的荷兰国旗问题&#xff0c;根据题目意思&#xff0c;要对这个数组按照颜色排序&#xff0c;而此时现在的红、白、蓝三个颜色分别对应0&#xff0c;1&#xff0c;2&#xff0c;因此可以想到使用冒泡排序对该数组进行排序。 代码如下&…

传统神经网络、CNN与RNN

在网络上找了很多关于深度学习的资料&#xff0c;也总结了一点小心得&#xff0c;于是就有了下面这篇文章。这里内容较为简单&#xff0c;适合初学者查看&#xff0c;所以大佬看到这里就可以走了。 话不多说&#xff0c;上图 #mermaid-svg-Z3k5YhiQ2o5AnvZE {font-family:&quo…

1371. 货币系统-dp背包问题

给定 V种货币&#xff08;单位&#xff1a;元&#xff09;&#xff0c;每种货币使用的次数不限。 不同种类的货币&#xff0c;面值可能是相同的。 现在&#xff0c;要你用这 V种货币凑出 N 元钱&#xff0c;请问共有多少种不同的凑法。 输入格式 第一行包含两个整数 V 和 N…

python和Java的区别

Python和Java是两种流行的编程语言&#xff0c;它们之间有一些重要的区别&#xff1a; 语法&#xff1a;Python是一种动态类型的脚本语言&#xff0c;语法简洁明了&#xff0c;通常使用缩进来表示代码块。Java是一种静态类型的编程语言&#xff0c;语法更为严格&#xff0c;需要…