set基于红黑树,元素有序,操作时间复杂度O(log n);unordered_set基于哈希表,无序,平均操作O(1),适合追求效率且无需排序的场景。

在c++中,set 和 unordered_set 都是标准模板库(STL)提供的关联式容器,用于存储唯一元素。虽然它们功能相似,但在底层实现、性能特性以及使用场景上有显著区别。
1. 底层数据结构不同
set 的底层基于红黑树(一种自平衡二叉搜索树)。这种结构保证了元素在插入、删除和查找时都能保持有序,并且时间复杂度稳定。
unordered_set 的底层基于哈希表(Hash table),通过哈希函数将元素映射到桶中。它不维护元素的顺序,但平均情况下操作速度更快。
2. 元素是否有序
set 中的元素是自动排序的,默认按升序排列。你可以自定义比较函数来改变排序规则。
立即学习“C++免费学习笔记(深入)”;
unordered_set 中的元素无固定顺序,遍历时的顺序不可预测,取决于哈希函数和冲突处理方式。
3. 时间复杂度对比
由于底层结构不同,两者在常见操作上的效率也不同:
- set:插入、删除、查找的时间复杂度均为 O(log n),因为红黑树的高度是 log n 级别。
- unordered_set:平均情况下这些操作为 O(1),但在哈希冲突严重时可能退化到 O(n)。
4. 是否支持自定义类型
set 只要求自定义类型支持比较操作(如 < 运算符或提供比较函数对象)即可使用。
unordered_set 要求自定义类型必须提供哈希函数,即特化 std::hash 或传入自定义哈希函数对象,否则无法编译。
5. 内存开销与性能特点
set 每个节点需要存储左右子树指针和颜色标记,内存开销较大,但由于结构稳定,性能可预期。
unordered_set 哈希表需要预留足够桶空间以减少冲突,可能会有较多内存浪费;但平均访问速度快,适合对性能敏感的场景。
基本上就这些。选择哪个容器取决于你是否需要有序性、数据规模以及对性能的要求。如果需要排序,选 set;如果追求速度且不关心顺序,unordered_set 更合适。