HashSet源码解读

xiaoxiao2021-02-28  51

HashSet概述

HashSet是基于hashmap实现的,HashSet的底层是用hashmap来保存所有的元素

hashset源码比较简单,但是必须在hashmap的基础上去理解。可以参考我的hash源码解读来理解

//可以看到底层使用hashmap来保存hashset中的元素 不序列化 private transient HashMap<E,Object> map; //定义一个虚拟的对象做为HashMap的value,将此对象定义为static final private static final Object PRESENT = new Object(); 构造函数: public HashSet() {map = new HashMap<>();}public HashSet(Collection<? extends E> c) {map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16)); addAll(c);}public HashSet(int initialCapacity, float loadFactor) {map = new HashMap<>(initialCapacity, loadFactor);}public HashSet(int initialCapacity) {map = new HashMap<>(initialCapacity);}HashSet(int initialCapacity, float loadFactor, boolean dummy) {map = new LinkedHashMap<>(initialCapacity, loadFactor);}

重点看add方法

public boolean add(E e) { return map.put(e, PRESENT)==null; }

 

接着点进map.put方法里

 

final putVal(int hash, key, value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;//  第一次add就初始化if ((p = tab[i = (n - 1) & hash]) == null)// A    (n - 1) & hash 取摸操作得到对应的哈希桶 如果此桶里没有数据就新建一个node节点   

tab[i] = newNode(hash, key, value, null);else {//如果取模运算 找到对应的hash桶,桶里有数据,不为空Node<K,V> e; k;if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))//B 这部判断hash值是否相等 key的equals是true就把原先的node赋值给新的node节点变量e e = p;else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {for (int binCount = 0; ; ++binCount) {if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);if (binCount >= TREEIFY_THRESHOLD 1// -1 for 1st treeifyBin(tab, hash);break;}if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) {//C 如果e不为空说明有需要覆盖的节点 oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;//覆盖节点值,并返回旧的valueafterNodeAccess(e);return oldValue;}}++modCount;if (++size threshold)resize();afterNodeInsertion(evict);return null;//D}

如果是如果没有对应的key的值就会走A D 两步,返回null,如果有对应的key值就会走A B C 三步

 

再看hashset的add方法

public boolean add(E e) { return map.put(e, PRESENT)==null; }

如果有重复的key,map.put(e, PRESENT)==null就返回false,表示添加失败

如果没有重复的key,会返回true,表示添加成功

从上述HashSet的源代码可以看出,他其实就是一个对HashMap的封装而已,所有的放入HashSet中的集合元素实际上由HashMap的key保存,而HashMap的value则存储了一个PERSENT,它是一个静态的Object对象

HashSet的绝大部分都是通过HashMap的方法来实现的,因此HashSet和HashMap两个集合在实现本质上是相同的

根据HashMap的一个特性,讲一个key-value放入hashmap中时。首先根据key的hashcode()返回值决定该Entry的存储位置,如果key相等,他们的存储位置相同,如果key的equals比较返回true,那么新添加的Entry的value会覆盖原来Entry的value。key不会覆盖,如果向HashSet中添加已经存在的元素,新添加的集合元素不会覆盖原来已有的集合元素

当我们要将一个类作为HashMap的key或者存储在HashSet的时候。通过重写hashCode()和equals(Object object)方法很重要,并且保证这两个方法的返回值一致。当两个类的hashCode()返回一致时,应该保证equasl()方法也返回true。

作者简介 猫眼电影女程序员 热爱技术和源码 我的技术公众号心情开花欢迎关注
转载请注明原文地址: https://www.6miu.com/read-2627936.html

最新回复(0)