前面已经讲解了Arraylist,但是留下了一个知识点没有说明,Iterator的fail-fast机制。本篇博客主要讲解一下这个机制。
Fail-fast简介
下面是Java官方在Arraylist的介绍中一段描述fail-fast的话
1 | if the list is structurally modified at any time after the iterator is created, in any way except through the iterator's own remove or add methods, the iterator will throw a ConcurrentModificationException. Thus, in the face of concurrent modification, the iterator fails quickly and cleanly, rather than risking arbitrary, non-deterministic behavior at an undetermined time in the future. |
大概的意思就是说:当通过list返回一个Iterator或者ListIterator对象之后,除了Iterator和ListIterator对象自己对集合的修改之外的其他任何修改集合的行为,都会报ConcurrentModificationException。因此在面对并发修改时,迭代器会快速而干净的失败,也就是不对List对象的状态有任何的修改,同时不会在未来某个不确定的时间产生任意的风险和不确定的行为。
用下面通俗的话来说就是:
fail-fast 机制是java集合(Collection)中的一种错误机制。当多个线程对同一个集合的内容进行操作时,就可能会产生fail-fast事件。
例如:当某一个线程A通过iterator去遍历某集合的过程中,若该集合的内容被其他线程所改变了;那么线程A访问集合时,就会抛出ConcurrentModificationException异常,产生fail-fast事件。
Fail-fast示例
1 | /** |
运行上面代码,会抛出异常:java.util.ConcurrentModificationException!即,产生fail-fast事件!
结果说明:
FastFailTest中通过 new ThreadOne().start() 和 new ThreadTwo().start() 同时启动两个线程去操作list。
ThreadOne线程:向list中依次添加0,1,2,3,4,5。每添加一个数之后,就通过printAll()遍历整个list。
ThreadTwo线程:向list中依次添加10,11,12,13,14,15。每添加一个数之后,就通过printAll()遍历整个list。
当某一个线程遍历list的过程中,list的内容被另外一个线程所改变了;就会抛出ConcurrentModificationException异常,产生fail-fast事件。
Fail-fast原理
产生fail-fast事件,是通过抛出ConcurrentModificationException异常来触发的。那么,ArrayList是如何抛出ConcurrentModificationException异常的呢?
在前一篇博客里面我们已经分析了ArrayList的源码。下面是摘录
1 | //实现list通用的迭代器 |
从中,我们可以发现在调用 next() 和 remove()时,都会执行 checkForComodification()。若 “modCount 不等于 expectedModCount”,则抛出ConcurrentModificationException异常,产生fail-fast事件。
要搞明白 fail-fast机制,我们就要需要理解什么时候“modCount 不等于 expectedModCount”!从Itr类中,我们知道 expectedModCount 在创建Itr对象时,被赋值为 modCount。通过Itr,我们知道:expectedModCount不可能被修改为不等于 modCount。所以,需要考证的就是modCount何时会被修改。
上一篇博客里面分析ArrayList源码时,里面只要涉及到修改ArrayList的地点,都会对modCount加1,这些修改包括add(),remove(),clear()等等。
接下来,我们再系统的梳理一下fail-fast是怎么产生的。步骤如下:
- 新建了一个ArrayList,名称为arrayList
- 向arrayList中添加内容。
- 新建一个“线程a,并在线程a中通过Iterator反复的读取arrayList的值
- 新建一个线程b,在线程b中删除arrayList中的一个节点A
- 这时,就会产生有趣的事件了。在某一时刻,线程a创建了arrayList的Iterator。此时节点A仍然存在于arrayList中,创建arrayList时,expectedModCount = modCount(假设它们此时的值为N)。在线程a在遍历arrayList过程中的某一时刻,线程b执行了,并且线程b删除了arrayList中的节点A。线程b执行remove()进行删除操作时,在remove()中执行了
modCount++
,此时modCount变成了N+1!线程a接着遍历,当它执行到next()函数时,调用checkForComodification()比较expectedModCount和modCount的大小;而expectedModCount=N
,modCount=N+1
,这样,便抛出ConcurrentModificationException异常,产生fail-fast事件。
至此,我们就完全了解了fail-fast是如何产生的!
即,当多个线程对同一个集合进行操作的时候,某线程访问集合的过程中,该集合的内容被其他线程所改变(即其它线程通过add、remove、clear等方法,改变了modCount的值);这时,就会抛出ConcurrentModificationException异常,产生fail-fast事件。
解决fail-fast方式
抛出这种错误的原因是因为出现并发操作,主要由以下俩种方式来解决
- 我们可以使用
Collections.synchronizedList
包装一下Arraylist,对每个方法都是用Synchronize进行同步 - 使用JUC中线程安全的集合类,类如
CopyOnWriteList
来替代ArrayList
Fail-fast存在的问题
从前面可以看到,Fail-fast产生的原因是expectedModCount和modCount不相等,就会抛出异常,什么时间会修改modCount,在删除或者新增的时候会修改,如果是更新呢,根据ArrayList的源码可以看出,是不会对modCount进行修改,因此如果遍历数据的时候,只是修改数据,则不会出现Fail-fast的问题,因此会带来数据不一致的问题,但是ArrayList本身也没有保证一致性。