集合系列文章:和我一起读Java8 LinkedList源码
首先放一张Java集合接口图:
Collection是一个独立元素序列,这些元素都服从一条或多条规则,List必须按照插入的顺序保存元素,而Set不能有重复元素,Queue按照排队规则来确定对象产生的顺序。
List在Collection的基础上添加了大量的方法,使得可以在List的中间插入和移除元素。
有2种类型的List:
- ArrayList 它长于随机访问元素,但是在List中间插入和移除元素较慢。
- LinkedList 它通过代价较低的方式在List中间进行插入和删除,但是在随机访问方面相对较慢,但是它的特性急较ArrayList大。
还有个第一代容器Vector,后面仅作比较。
下面正式进入ArrayList实现原理,主要参考Java8 ArrayList源码
####类定义
1 | 复制代码public class ArrayList<E> extends AbstractList<E> |
ArrayList 继承了AbstractList并且实现了List,所以具有添加,修改,删除,遍历等功能
实现了RandomAccess接口,支持随机访问
实现了Cloneable接口,支持Clone
实现了Serualizable接口,可以被序列化
####底层数据结构
1 | 复制代码transient Object[] elementData; //存放元素的数组 |
ArrayList的底层实际是通过一个Object的数组实现,数组本身有个容量capacity,实际存储的元素个数为size,当做一些操作,例如插入操作导致数组容量不够时,ArrayList就会自动扩容,也就是调节capacity的大小。
####初始化
指定容量大小初始化
1 | 复制代码/** |
初始化一个指定容量的空集合,若是容量为0,集合为空集合,其中private static final Object[] EMPTY_ELEMENTDATA = {};
,容量也为0。
无参数初始化
1 | 复制代码/** |
无参数初始化,其实DEFAULTCAPACITY_EMPTY_ELEMENTDATA
的定义也为:private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
与EMPTY_ELEMENTDATA
的区别是当第一个元素被插入时,数组就会自动扩容到10,具体见下文说add方法时的解释。
集合作为初始化参数
1 | 复制代码/** |
构造一个包含指定 collection 的元素的列表,这些元素按照该collection的迭代器返回它们的顺序排列的。
####size和IsEmpty
首先是两个最简单的操作:
1 | 复制代码public int size() { |
1 | 复制代码public boolean isEmpty() { |
都是依靠size值,直接获取容器内元素的个数,判断是否为空集合。
#####Set 和Get操作
Set和Get操作都是直接操作集合下标
1 | 复制代码public E set(int index, E element) { |
1 | 复制代码public E get(int index) { |
在操作之前都会做RangeCheck检查,如果index超过size,则会报IndexOutOfBoundsException错误。
elementData的操作实际就是基于下标的访问,所以ArrayList 长于随机访问元素,复杂度为O(1)。
1 | 复制代码@SuppressWarnings("unchecked") |
####Contain
1 | 复制代码public boolean contains(Object o) { |
contains 函数基于indexOf函数,如果第一次出现的位置大于等于0,说明ArrayList就包含该元素, IndexOf的实现如下:
1 | 复制代码public int indexOf(Object o) { |
ArrayList是接受null值的,如果不存在该元素,则会返回-1
,所以contains判断是否大于等于0来判断是否包含指定元素。
####Add和Remove
1 | 复制代码public boolean add(E e) { |
首先确保已有的容量在已使用长度加1后还能存下下一个元素,这里正好分析下用来确保ArrayList容量ensureCapacityInternal
函数:
1 | 复制代码private void ensureCapacityInternal(int minCapacity) { |
这边可以返回看一开始空参数初始化,this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA
, 空参数初始化的ArrayList添加第一个元素,上面的if语句就会调用,DEFAULT_CAPACITY
定义为10,所以空参数初始化的ArrayList一开始添加元素,容量就变为10,在确定了minCapacity后,还要调用ensureExplicitCapacity(minCapacity)
去真正的增长容量:
1 | 复制代码private void ensureExplicitCapacity(int minCapacity) { |
这里modCount默默记录ArrayList被修改的次数, 然后是判断是否需要扩充数组容量,如果当前数组所需要的最小容量大于数组现有长度,就调用自动扩容函数grow:
1 | 复制代码private void grow(int minCapacity) { |
oldCapacity记录数组原有长度,newCapacity直接将长度扩展为原来的1.5倍,如果1.5倍的长度大于需要扩充的容量(minCapacity),就只扩充到minCapacity,如果newCapacity大于数组最大长度MAX_ARRAY_SIZE,就只扩容到MAX_ARRAY_SIZE大小,关于MAX_ARRAY_SIZE为什么是private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
,我文章里就不深究了,感兴趣的可以参考stackoverflow上的有关回答:
Why the maximum array size of ArrayList is Integer.MAX_VALUE - 8?
Add还提供两个参数的形式,支持在指定位置添加元素。
1 | 复制代码public void add(int index, E element) { |
在指定位置添加元素之前,先把index位置起的所有元素后移一位,然后在index处插入元素。
1 | 复制代码public E remove(int index) { |
Remove接口也很好理解了,存储index位置的值到oldView作为返回值,将index后面所有的元素都向前拷贝一位,不要忘记的是还要将原来最后的位置标记为null,以便让垃圾收集器自动GC这块内存。
还可以根据对象Remove:
1 | 复制代码public boolean remove(Object o) { |
找到对象所在位置,调用FastRemove函数快速删除index位置上的元素,FastRemove也就是比remove(index)少了个边界检查。
#####clear
1 | 复制代码/** |
由于Java有GC机制,所以不需要手动释放内存,只要将ArrayList所有元素都标记为null,垃圾收集器就会自动收集这些内存。
Add和Remove都提供了一系列的批量操作接口:
1 | 复制代码public boolean addAll(Collection<? extends E> c); |
相比于单文件一次只集体向前或向后移动一位,批量操作需要移动Collection 长度的距离。
####Iterator与fast_fail
首先看看ArrayList里迭代器是如何实现的:
1 | 复制代码private class Itr implements Iterator<E> { |
ArrayList里可以通过iterator方法获取迭代器,iterator方法就是new一个上述迭代器对象:
1 | 复制代码public Iterator<E> iterator() { |
那么我们看看Itr
类的主要方法:
- next :获取序列的下一个元素
- hasNext:检查序列中是否还有元素
- remove:将迭代器新近返回的元素删除
在next和remove操作之前,都会调用checkForComodification函数,如果modCount和本身记录的expectedModCount不一致,就证明集合在别处被修改过,抛出ConcurrentModificationException异常,产生fail-fast事件。
fail-fast 机制是java集合(Collection)中的一种错误机制。当多个线程对同一个集合的内容进行操作时,就可能会产生fail-fast事件。
例如:当某一个线程A通过iterator去遍历某集合的过程中,若该集合的内容被其他线程所改变了;那么线程A访问集合时,就会抛出ConcurrentModificationException异常,产生fail-fast事件。
一般多线程环境下,可以考虑使用CopyOnWriteArrayList来避免fail-fast。
本文转载自: 掘金