1. STL常见容器及其内部实现的数据结构
序号 名称 描述 存储结构 常用方法和操作
| 1 | vector | 动态分配的数组 | 顺序数组(array) | v.push_back(), v.pop_back(), v.insert(), v.erase(), v.capacity(), v.size(), v.at(idx), v.front(), v.back() |
| 2 | list | 双向链表 | 离散 | lt.push_back(), lt.push_front(), lt.insert(), lt.erase(), lt.sort(), lt.merge(), lt.splice() |
| 3 | stack | 栈 | 用 list 或 deque 实现 | push(), pop(), top() |
| 4 | queue | 队列 | 用 list 或 deque 实现 | push(), pop(), front(), back() |
| 5 | deque | 双端队列 | 分段连续(多个 vector 连续) | d.push_back(), d.push_front(), d.pop_back(), d.pop_front(), d.insert(), d.erase() |
| 6 | priority_queue | 优先级队列 | vector | push(), pop(), top() |
| 7 | set | 集合(有序不重复) | 红黑树(弱平衡二叉搜索树) | insert(), erase(), find(), count(), clear() |
| 8 | multiset | 集合(有序可重复) | 红黑树 | insert(), erase(), find(), count(), clear() |
| 9 | unordered_set | 集合(无序不重复) | 哈希表 | insert(), erase(), find(), count(), clear() |
| 10 | map | 键值对(有序不重复) | 红黑树 | insert(), erase(), find(), count(), clear() |
| 11 | multimap | 键值对(有序可重复) | 红黑树 | insert(), erase(), find(), count(), clear() |
| 12 | unordered_map | 键值对(无序不重复) | 哈希表 | insert(), erase(), find(), count(), clear() |
| 13 | hash_map | 哈希表(类似 map) | 哈希表 | insert(), erase(), find(), count(), clear() |
2. deque底层数据结构
deque 底层实现通常是分段连续的内存结构,即由多个 vector 组成,允许高效的从两端进行元素的插入和删除。
3. 红黑树
红黑树是一种非严格平衡的二叉查找树,具有自动排序的功能。每个节点存储一个颜色(红或黑),并且通过调整树的结构保持特定的平衡条件,从而保证最坏情况下的查找效率。
4. 常见排序算法
4.1 sort()
- 适用容器:仅支持随机访问的容器,如
vector、deque、array。 - 功能:快速排序。
bool func(int a, int b) {return a > b; // 降序排列
}
sort(vec.begin(), vec.end(), func); // 对vector进行排序
4.2 partial_sort()
- 功能:对部分元素进行排序,使用堆排序实现。
- 参数:排序范围,默认排序前
n个元素。
int n = 4; // 需要排序的元素个数
partial_sort(vec.begin(), vec.begin() + n, vec.end(), func); // 排序前4个元素
4.3 is_sorted()
- 功能:检查容器是否已排序。
- 返回值:布尔值,
true表示已排序。
bool result = is_sorted(vec.begin(), vec.end(), func);
4.4 is_sorted_until()
- 功能:返回第一个破坏排序规则的元素位置。
auto it = is_sorted_until(vec.begin(), vec.end(), func);
5. 查找操作
5.1 find()
- 功能:查找指定元素。
vector<int> vec{10, 20, 30, 40, 50};
auto it = find(vec.begin(), vec.end(), 30); // 查找30
if (it != vec.end()) {cout << "查找成功:" << *it;
} else {cout << "查找失败";
}
5.2 find_if()
- 功能:根据自定义谓词查找元素。
bool mycomp(int i) {return (i % 2) == 1; // 查找奇数
}
vector<int> myvector{4, 2, 3, 1, 5};
auto it = find_if(myvector.begin(), myvector.end(), mycomp);
6. 使用 vector 避免频繁的内存重新分配
vector 在扩容时通常会以 2 倍容量增长,这会导致频繁的内存分配和元素拷贝。为了优化性能,可以采取以下策略:
6.1 预分配内存
在创建 vector 时,可以使用 reserve() 方法预先分配内存,以减少多次扩容。
6.2 合理选择初始容量
根据数据的预计大小选择合适的初始容量,避免不必要的扩容操作。
6.3 优化算法
使用时间复杂度较低的算法,避免在数据量增大时造成性能瓶颈。
7. vector 的 resize() 与 reserve()
7.1 resize()
- 功能:调整容器的大小。
- 效果:如果
n小于当前大小,则删除尾部元素;如果n大于当前大小,新的元素会被默认构造并添加到尾部。
7.2 reserve()
- 功能:调整容器的容量,不会改变当前大小。
- 效果:用于减少扩容次数,确保容器有足够的内存空间。
8. vector 扩容原理
- 扩容过程:每次扩容时,
vector会分配新的内存块并将现有元素复制到新内存中,旧内存被释放。 - 扩容系数:通常情况下,
vector容量每次会翻倍或增加 1.5 倍,这可以减少频繁的扩容。
8.1 Linux中的内存管理
在Linux系统中,内存区域以2的倍数扩容,以便进行高效的内存分配。
8.2 Windows中的内存管理
在Windows系统中,内存分配通常会增加1.5倍,以便更好地利用已经释放的内存。
9. 迭代器
迭代器是STL中用于访问容器元素的一种抽象工具。通过迭代器,容器元素的访问具有一致的接口,并且可以实现多态。
注意:迭代器只能前进,不能回退。
10. 迭代器失效的情况
迭代器可能会因为容器结构的修改而失效。不同类型的容器失效的情况略有不同:
- 数组型数据结构(如
vector):insert和erase操作会使插入或删除点之后的所有迭代器失效。 - 链表型数据结构(如
list):erase操作只会使指向删除元素的迭代器失效,其他迭代器不受影响。 - 树型数据结构(如
map):erase操作会使指向删除元素的迭代器失效,其他迭代器不受影响。insert操作不会使任何迭代器失效。