6miu盘搜

HashMap巩固二：多线程问题

xiaoxiao2021-02-28 106

转载请注明来源-作者@loongshawn：http://blog.csdn.net/loongshawn/article/details/77759523，建议读者阅读原文，确保获得完整的信息

由于HashMap是非同步的，所以多线程操作时不可避免产生问题，其中突出的问题时get时产生死循环。

在了解“产生get死循环”之前，先来看看其触发环境，即rehash环节，rehash表示动态扩容，即HashMap的容量超过阈值后，会执行resize操作，每次执行put操作，都会进行容量判断，看看resize代码：

final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } // 旧容量扩容2倍没超过最大容量，且旧容量大于16，则新容量与阈值扩容2倍 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold } else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; // 初始化HashMap时，默认容量16，阈值12。 else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } // 旧容量小于16，新容量等于旧阈值，新阈值等于0 if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // preserve order Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }

依据resize函数看出，扩容动作是开销很大的动作，因此初始化HashMap时先估算一下大致容量(table[].length)，给一个初始值，即使用HashMap的构造函数，负载因子参数用系统默认值，这样可以避免频繁扩容，额外增加系统开销：

public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR); }

多线程产生的死循环问题就是在rehash环节产生的，下面来说明这个问题，结合网上有代表性的这个例子：

1、假设定义hashMap的hash算法是mod表的大小； 2、LOAD_FACTOR负载因子为1； 3、初始化表大小2。 4、put的顺序为5、7、3

table size为2时：

5、7、3都发生了碰撞，其table下标index=(length-1)&hash，此时index都为1。

触发rehash操作：

put 3时，其size大于阈值，触发resize操作，table大小扩展为4。

table size为4时：

put 5时，index=1； put 7时，index=3；

现在有两线程thread1和thread2：

thread1执行put 3但没有执行resize，此时key3的next是key7。thread2执行resize操作，此时key7的next是key3。

这样就会使得key3和key7形成一个闭环，后续get操作时就会一直阻塞。

转载请注明原文地址: https://www.6miu.com/read-60933.html

技术

最新回复(0)