HashSet:基于哈希表实现的集合,用于存储不重复的元素。
HashSet<String> set = new HashSet<>();
set.add("Item 1");
set.add("Item 2");
HashSet 是一个不允许存储重复元素的集合,它的实现比较简单,只要理解了 HashMap,HashSet 就水到渠成了。HashSet 的底层实现是基于 HashMap 的,它实际上是通过 HashMap 来实现的,只不过在 HashSet 中只使用了 HashMap 的键,而没有使用值。
- HashMap:HashSet 内部维护了一个 HashMap 对象,作为存储元素的载体。
- 存储元素:当向 HashSet 中添加元素时,实际上是将该元素作为 HashMap 的键存储,而值则存储为一个常量,比如 PRESENT = new Object()。
- 哈希表:HashMap 的键是唯一的,因此 HashSet 中不会有重复元素。HashSet 利用 HashMap 键的唯一性来保证其中不会有重复元素。
- 去重:当调用 HashSet 的 add()方法时,实际上是调用了 HashMap 的put()方法,将元素作为键存储到 HashMap 中,如果这个键已经存在,put()方法会返回旧值,如果是新键,则返回null。这样就保证了 HashSet 中不会有重复元素。
- 查找:当调用 HashSet 的 contains()方法时,实际上是调用了 HashMap 的containsKey()方法来判断元素是否存在。
成员变量
首先了解下 HashSet 的成员变量:
    private transient HashMap<E,Object> map;// Dummy value to associate with an Object in the backing Mapprivate static final Object PRESENT = new Object();
发现主要就两个变量:
- map:用于存放最终数据的。
- PRESENT:是所有写入 map 的- value值。
构造函数
    public HashSet() {map = new HashMap<>();}public HashSet(int initialCapacity, float loadFactor) {map = new HashMap<>(initialCapacity, loadFactor);}    
构造函数很简单,利用了 HashMap 初始化了 map 。
add
    public boolean add(E e) {return map.put(e, PRESENT)==null;}
比较关键的就是这个 add() 方法。 可以看出它是将存放的对象当做了 HashMap 的健,value 都是相同的 PRESENT 。由于 HashMap 的 key 是不能重复的,所以每当有重复的值写入到 HashSet 时,value 会被覆盖,但 key 不会受到影响,这样就保证了 HashSet 中只能存放不重复的元素。
总结
HashSet 的原理比较简单,几乎全部借助于 HashMap 来实现的。由于 HashSet 的底层是基于 HashMap 实现的,因此具有 HashMap 的特性,如高效的添加、查找操作(平均情况下为 O(1)),去重功能等。不过需要注意的是,HashSet 并不保证元素的顺序,元素存储的顺序与插入顺序可能不同,因为它是根据哈希值存储的。
所以 HashMap 会出现的问题 HashSet 依然不能避免。