今天开始学习ArrayList源码。参考的JDK版本为1.8。
相信大家对ArrayList的使用已经很熟悉了,但你真的了解ArrayList吗?ArrayList源码中注释的第一行是“Resizable-array implementation of the List interface”,意为“List接口的可变长数组实现”。ArrayList是如何实现可变长的?ArrayList有哪些私有方法?它们对ArrayList的功能起到了什么作用?本文将从数据结构、实现原理、源码等角度分析ArrayList,帮助大家更好的使用它。
如图所示,ArrayList底层通过数组实现。
List接口的大小可变数组的实现。实现了所有可选列表操作,并允许包括null在内的所有元素。除了实现List接口外,此类还提供一些方法来操作内部用来存储列表的数组的大小。(此类大致上等同于Vector类,除了此类是不同步的。)
size、isEmpty、get、set、iterator和listIterator操作都以固定时间运行。add操作以分摊的固定时间运行,也就是说,添加n个元素需要O(n)时间。其他所有操作都以线性时间运行(大体上讲)。与用于LinkedList实现的常数因子相比,此实现的常数因子较低。
每个ArrayList实例都有一个容量。该容量是指用来存储列表元素的数组的大小。它总是至少等于列表的大小。随着向ArrayList中不断添加元素,其容量也自动增长。并未指定增长策略的细节,因为这不只是添加元素会带来分摊固定时间开销那样简单。
在添加大量元素前,应用程序可以使用ensureCapacity操作来增加ArrayList实例的容量。这可以减少递增式再分配的数量。
注意,此实现不是同步的。如果多个线程同时访问一个ArrayList实例,而其中至少一个线程从结构上修改了列表,那么它必须保持外部同步。(结构上的修改是指任何添加或删除一个或多个元素的操作,或者显式调整底层数组的大小;仅仅设置元素的值不是结构上的修改。)这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象,则应该使用Collections.synchronizedList方法将该列表“包装”起来。这最好在创建时完成,以防止意外对列表进行不同步的访问: List list = Collections.synchronizedList(new ArrayList(…));
此类的iterator和listIterator方法返回的迭代器是快速失败的:在创建迭代器之后,除非通过迭代器自身的remove或add方法从结构上对列表进行修改,否则在任何时间以任何方式对列表进行修改,迭代器都会抛出ConcurrentModificationException。因此,面对并发的修改,迭代器很快就会完全失败,而不是冒着在将来某个不确定时间发生任意不确定行为的风险。
注意,迭代器的快速失败行为无法得到保证,因为一般来说,不可能对是否出现不同步并发修改做出任何硬性保证。快速失败迭代器会尽最大努力抛出ConcurrentModificationException。因此,为提高这类迭代器的正确性而编写一个依赖于此异常的程序是错误的做法:迭代器的快速失败行为应该仅用于检测bug。
此类是Java Collections Framework的成员。
从上面的内容中可以总结出以下几点:
底层:ArrayList是List接口的大小可变数组的实现。是否允许null:ArrayList允许null元素。时间复杂度:size、isEmpty、get、set、iterator和listIterator方法都以固定时间运行,时间复杂度为O(1)。add和remove方法需要O(n)时间。与用于LinkedList实现的常数因子相比,此实现的常数因子较低。容量:ArrayList的容量可以自动增长。是否同步:ArrayList不是同步的。迭代器:ArrayList的iterator和listIterator方法返回的迭代器是fail-fast的。先来看看ArrayList的定义:
public class ArrayList<E> extends AbstractList<E> implements List<E>,RandomAccess,Cloneable,java.io.Serializable
从中我们可以了解到:
ArrayList<E>:说明ArrayList支持泛型。extends AbstractList<E> :继承了AbstractList。AbstractList提供List接口的骨干实现,以最大限度地减少“随机访问”数据存储(如ArrayList)实现Llist所需的工作。implements List<E>:实现了List。实现了所有可选列表操作。implements RandomAccess:表明ArrayList支持快速(通常是固定时间)随机访问。此接口的主要目的是允许一般的算法更改其行为,从而在将其应用到随机或连续访问列表时能提供良好的性能。implements Cloneable:表明其可以调用clone()方法来返回实例的field-for-field拷贝。implements java.io.Serializable:表明该类具有序列化功能。但继承实现信息还不够完整,下图是ArrayList的类结构层次图。
。
如何查看类层次结构图可以参考文章: eclipse-查看继承层次图/继承实现层次图
思考:elementData被标记为transient,那么它的序列化和反序列化是如何实现的呢? ArrayList自定义了它的序列化和反序列化方式。详情请查看writeObject(java.io.ObjectOutputStream s)和readObject(java.io.ObjectOutputStream s)方法。
接下来,看ArrayList提供的构造方法。ArrayList提供了三种构造方法。
ArrayList(int initialCapacity):构造一个指定容量为capacity的空ArrayList。ArrayList():构造一个初始容量为 10 的空列表。ArrayList(Collection<? extends E> c):构造一个包含指定 collection 的元素的列表,这些元素是按照该 collection 的迭代器返回它们的顺序排列的。ArrayList( int initialCapacity)
/** * 构造一个指定初始化容量为capacity的空ArrayList。 * * @param initialCapacity ArrayList的指定初始化容量 * @throws IllegalArgumentException 如果ArrayList的指定初始化容量为负。 */ public ArrayList(int initialCapacity) { if (initialCapacity > 0) { this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } }ArrayList()
/** * 构造一个初始容量为 10 的空列表。 */ public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; }ArrayList(Collection<? extends E> c)
/** * 构造一个包含指定 collection 的元素的列表,这些元素是按照该 collection 的迭代器返回它们的顺序排列的。 * * @param c 其元素将放置在此列表中的 collection * @throws NullPointerException 如果指定的 collection 为 null */ public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); if ((size = elementData.length) != 0) { // c.toArray might (incorrectly) not return Object[] (see 6260652) if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } else { // replace with empty array. this.elementData = EMPTY_ELEMENTDATA; } }ArrayList有以下核心方法
方法名时间复杂度get(int index)O(1)add(E e)O(1)add(add(int index, E element))O(n)remove(int index)O(n)set(int index, E element)O(1)从代码中可以看到,因为ArrayList底层是数组,所以它的get方法非常简单,先是判断一下有没有越界,之后就直接通过数组下标来获取元素。get方法的时间复杂度是O(1)。
从源码中可以看到,add(E e)有两个步骤:
空间检查,如果有需要进行扩容插入元素空间检查和扩容的介绍在下面。
空间的问题解决后,插入过程就显得非常简单。
看完了代码,可以对扩容方法总结如下:
进行空间检查,决定是否进行扩容,以及确定最少需要的容量如果确定扩容,就执行grow(int minCapacity),minCapacity为最少需要的容量第一次扩容,逻辑为newCapacity = oldCapacity + (oldCapacity >> 1);即在原有的容量基础上增加一半。第一次扩容后,如果容量还是小于minCapacity,就将容量扩充为minCapacity。对扩容后的容量进行判断,如果大于允许的最大容量MAX_ARRAY_SIZE,则将容量再次调整为MAX_ARRAY_SIZE。至此扩容操作结束。从源码中可以看到,add(E e)有三个步骤:
越界检查空间检查,如果有需要进行扩容插入元素越界检查很简单
private void rangeCheckForAdd(int index) { if (index > size || index < 0) throw new IndexOutOfBoundsException(outOfBoundsMsg(index)); }空间检查和扩容的介绍在上面。
空间的问题解决后,插入过程就显得非常简单。
add(int index, E e)需要先对元素进行移动,然后完成插入操作,也就意味着该方法有着线性的时间复杂度,即O(n)。
看完代码后,可以将ArrayList删除指定索引的元素的步骤总结为
检查索引是否越界。如果参数指定索引index>=size,抛出一个越界异常将索引大于index的元素左移一位(左移后,该删除的元素就被覆盖了,相当于被删除了)。将索引为size-1处的元素置为null(为了让GC起作用)。注意:为了让GC起作用,必须显式的为最后一个位置赋null值。上面代码中如果不手动赋null值,除非对应的位置被其他元素覆盖,否则原来的对象就一直不会被回收。
ArrayList与迭代器模式
相关推荐:设计模式(16)-迭代器模式。
整理本文大约花了15个小时,不过都是值得的。内部类部分还有待补充。
本文已收录于Java8容器源码札记专栏。