注意
本系列文章是笔者在参考了大量优秀文章的基础上的理解,由于水平有限,难免会出现错误,望批评指正,同时我也会把自己最新的理解及时更新到文章中去。最后,我会在文中注明参考文章,特别感谢这些无私奉献的作者。
紧接着上一篇文章,我们知道了 ArrayList 是线程不安全的,那 Java 又为我们提供了哪些方式实现线程安全的 List 呢?
有三种方式:
1、Vector。
2、Collections.synchronizedList(List l)。
3、CopyOnWriteArrayList。
1 Vector
Vector 的代码思路几乎和ArrayList一致,不同点有如下:
1、每个操作方法都加了 synchronized 关键字保证同步。
2、调用 Vector 构造方法一定会新建数组。
3、当 capacityIncrement <=0 时,扩容后的数组大小会是原来的2倍,否则就在原来的基础上增加 capacityIncrement 。
相同点如下:
1、增删改查、遍历逻辑一致。
2、遍历过程中操作 Vector 或 List 都会导致 ConcurrentModificationException 异常,即他们都有 fast-fail 机制。
特别地,对于多线程操作 Vector 时,特殊场景依然会导致错误发生,具体请参考文末的参考资料中 1.2 部分的内容。
2 synchronizedList 方式
Collections 类下面的 synchronizedList 方法则是在原 List 外面包了一层 synchronized 而已,遇到高并发的场景,依然和 Vector 一样,性能很低。
3 CopyOnWriteArrayList
CopyOnWriteArrayList 内部维护着一个叫 array 的数组,它的定义如下:
1 | /** The array, accessed only via getArray/setArray. */ |
由注释可以知道,该变量只能通过 getArray/setArray 来取值赋值。
3.1 add(E e)
1 | public boolean add(E e) { |
大致思路是:加锁->依据旧数组新建一个长度比旧数组多1的新数组->将值放在新数组最后->替换旧数组为新数组的值->释放锁。
不知道你发现没有,CopyOnWriteArrayList 的扩容策略和 ArrayList、Vector 不一样了,它是按需分配新数组的大小来实现的扩容。
CopyOnWriteArrayList 的增删改方法在逻辑上类似,这里不一一介绍了。
3.2 get(int index)
1 | public E get(int index) { |
获取方法没有加锁的逻辑,直接是从旧数组中获取。
3.3 遍历
CopyOnWriteArrayList 的遍历方式也是分为两类。
第一类:
1 | for (int i = 0; i < size; i++) { |
第二类:
1 | Iterator iterator = copyOnWriteArrayList.iterator(); |
在第二类写法中,我们在讲ArrayList时说过不能在循环过程中对List进行增删改操作,原因就不再重复了,不知道的可以回过头去看看。CopyOnWriteArrayList 是没有这个限制的,它是如何做到的呢?
我们来看下 copyOnWriteArrayList.iterator() 做了什么。
1 | public Iterator<E> iterator() { |
iterator()和listIterator()是一样的,都生成了一个 COWIterator 对象,并传入了当前数组的值(注意是旧值)以及 initialCursor。
再来看看 COWIterator 类的实现。
1 | static final class COWIterator<E> implements ListIterator<E> { |
从代码中可以看出,COWIterator不支持增删改,也没有fast-fail机制,只提供了遍历功能。当在遍历过程中修改了 CopyOnWriteArrayList ,对遍历没有任何影响。
3.4 总结
CopyOnWriteArrayList缺点:
1、内存占用:如果CopyOnWriteArrayList经常要增删改里面的数据,经常要执行add()、set()、remove()的话,那是比较耗费内存的。因为我们知道每次add()、set()、remove()这些增删改操作都要复制一个数组出来。
2、数据一致性:CopyOnWrite容器只能保证数据的最终一致性,不能保证数据的实时一致性。
从上面的例子也可以看出来,比如线程A在迭代CopyOnWriteArrayList容器的数据。线程B在线程A迭代的间隙中将CopyOnWriteArrayList部分的数据修改了(已经调用setArray()了)。但是线程A迭代出来的是原有的数据。
CopyOnWriteArrayList优点:
保证了并发时的可靠性。
4 快速失败(fast-fail)和 安全失败(safe-fail)
一:快速失败(fail—fast)
在用迭代器遍历一个集合对象时,如果遍历过程中对集合对象的内容进行了修改(增加、删除、修改),则会抛出Concurrent Modification Exception。
原理:迭代器在遍历时直接访问集合中的内容,并且在遍历过程中使用一个 modCount 变量。集合在被遍历期间如果内容发生变化,就会改变modCount的值。每当迭代器使用hashNext()/next()遍历下一个元素之前,都会检测modCount变量是否为expectedmodCount值,是的话就返回遍历;否则抛出异常,终止遍历。
注意:这里异常的抛出条件是检测到 modCount!=expectedmodCount 这个条件。如果集合发生变化时修改modCount值刚好又设置为了expectedmodCount值,则异常不会抛出。因此,不能依赖于这个异常是否抛出而进行并发操作的编程,这个异常只建议用于检测并发修改的bug。
场景:java.util包下的集合类都是快速失败的,不能在多线程下发生并发修改(迭代过程中被修改)。
二:安全失败(fail—safe)
采用安全失败机制的集合容器,在遍历时不是直接在集合内容上访问的,而是先复制原有集合内容,在拷贝的集合上进行遍历。
原理:由于迭代时是对原集合的拷贝进行遍历,所以在遍历过程中对原集合所作的修改并不能被迭代器检测到,所以不会触发Concurrent Modification Exception。
缺点:基于拷贝内容的优点是避免了Concurrent Modification Exception,但同样地,迭代器并不能访问到修改后的内容,即:迭代器遍历的是开始遍历那一刻拿到的集合拷贝,在遍历期间原集合发生的修改迭代器是不知道的。
场景:java.util.concurrent包下的容器都是安全失败,可以在多线程下并发使用,并发修改。