柒夭日志：Java集合框架

开发运维 2023-10-02 穿过生命散发芬芳手机阅读

图文详解了 40 多道 Java 集合框架面试高频题，目标是成功上岸，从现在开始努力，加油！！！（手动狗头），本文转载链接，并且在原文的基础上增加了一些自己的理解和思考且在最后加上了一个 Queue 部分的内容，希望能对各位读者有所帮助！！！

引言

1. 说说有哪些常见集合，并且之间有什么区别？

集合相关类和接口都在 java.util 中，主要分为 3 种，分别是：List（列表）、Map（映射）、Set（集合）。

Java集合主要关系

其中 Collection 是集合 List、 Set、Queue 的父接口，它主要有三个子接口：

List：存储的元素有序，可以重复，有索引
Set：存储的元素无序，不可以重复，没有索引
Queue：队列集合，其存储的元素先入先出，后入后出

Map 是另外的接口，其是键值对映射结构的集合，这个是面试的重点内容，这里会着重讲这一部分的内容。

List

一般来说，List 可以问的东西可能不多，但是不排除面试官剑走偏锋，所以这里还是讲一讲大概内容。

2. ArrayList和LinkedList有什么区别？

数据结构不同

ArrayList 是基于数组实现的
LinkedList 是基于双链表实现的

多数情况下， ArrayList 更利于查找，LinkedList 更利于增删

ArrayList基于数组实现，get(int index)可以直接通过数组下标获取，时间复杂度是O(1)；LinkedList基于链表实现，get(int index)需要遍历链表，时间复杂度是O(n)；当然，get(E element)这种查找，两种集合都需要遍历，时间复杂度都是O(n)。

ArrayList增删如果是数组末尾的位置，直接插入或者删除就可以了，但是如果插入中间的位置，就需要把插入位置后的元素都向前或者向后移动，甚至还有可能触发扩容；双向链表的插入和删除只需要改变前驱节点、后继节点和插入节点的指向就行了，不需要移动元素。

注意，这个地方可能会出陷阱，LinkedList更利于增删更多是体现在平均步长上，不是体现在时间复杂度上，二者增删的时间复杂度都是O(n)

是否支持随机访问

ArrayList基于数组，所以它可以根据下标查找，支持随机访问，当然，它也实现了RandmoAccess 接口，这个接口只是用来标识是否支持随机访问。

内存占⽤，ArrayList基于数组，是⼀块连续的内存空间，LinkedList基于链表，内存空间不连续，它们在空间占⽤上都有⼀些额外的消耗：

因为 ArrayList 是预先定义好数组的，所以其有一些内存空间可能没有使用到，所以存在着一定程度上的空间浪费
LinkedList 的每个节点都需要存储前驱以及后继，所以每个节点可能占用更多的内容和空间，以下是关于这个链表的一个简单示例：

public Class Node{
    private Node pre;
    private T data;
    private Node next;
}

3.ArrayList的扩容机制了解吗？

ArrayList是基于数组的集合，数组的容量是在定义的时候确定的，如果数组满了，再插入，就会数组溢出。所以在插入时候，会先检查是否需要扩容，如果当前容量+1超过数组长度，就会进行扩容。

ArrayList的扩容是先创建一个原先容量 1.5倍的新数组，然后再将原数组的值遍历拷贝过去。

4.ArrayList怎么序列化的知道吗？为什么用transient修饰数组？

ArrayList的序列化不太一样，它使用 transient 修饰存储元素的 elementData 的数组，transient 关键字的作用是为了让被修饰的成员属性不被序列化。

这里可能有几个疑问哈，看我详细道来：

（1）为什么 ArrayList 不直接序列化元素呢？

出于效率考虑，数组可能长度为 100，但是实际却用了 50，剩下的 50 不用其实不用进行序列化，这样的的可以提高序列化和反序列化的效率，还可以节省内存空间。

（2）那 ArrayList 怎么序列化呢？

ArrayList 通过两个方法 readObject、writeObject自定义序列化和反序列化策略。实际上直接使用 ObjectOutputStream 和 ObjectInputStream 来进行序列化和反序列化。

5.快速失败(fail-fast)和安全失败(fail-safe)了解吗？

快速失败（fail-fast）：快速失败是 Java 集合的一种错误检测机制

在用迭代器遍历一个集合对象时，如果线程A遍历过程中，线程B对集合对象的内容进行了修改（增加、删除、修改），则会抛出 Concurrent Modification Exception。
原理：迭代器在遍历时直接访问集合中的内容，并且在遍历过程中使用一个 modCount ****变量。集合在被遍历期间如果内容发生变化，就会改变 modCount 的值。每当迭代器使用 hashNext()/next() 遍历下一个元素之前，都会检测 modCount 变量是否为 expectedmodCount 值，是的话就返回遍历；否则抛出异常，终止遍历。
注意：这里异常的抛出条件是检测到 modCount！=expectedmodCount 这个条件。如果集合发生变化时修改 modCount 值刚好又设置为了expectedmodCount 值，则异常不会抛出。因此，不能依赖于这个异常是否抛出而进行并发操作的编程，这个异常只建议用于检测并发修改的 bug。
场景：java.util包下的集合类都是快速失败的，不能在多线程下发生并发修改（迭代过程中被修改），比如 ArrayList 类。

安全失败（fail-safe） : 其是 Java 集合的另一种错误检测机制

采用安全失败机制的集合容器，在遍历时不是直接在集合内容上访问的，而是先复制原有集合内容，在拷贝的集合上进行遍历。
原理：由于迭代时是对原集合的拷贝进行遍历，所以在遍历过程中对原集合所作的修改并不能被迭代器检测到，所以不会触发 Concurrent Modification Exception。
缺点：基于拷贝内容的优点是避免了Concurrent Modification Exception，但同样地，迭代器并不能访问到修改后的内容，即：迭代器遍历的是开始遍历那一刻拿到的集合拷贝，在遍历期间原集合发生的修改迭代器是不知道的。
场景：java.util.concurrent包下的容器都是安全失败，可以在多线程下并发使用，并发修改，比如CopyOnWriteArrayList类。

6.有哪几种实现ArrayList线程安全的方法？

fail-fast是一种可能触发的机制，实际上，ArrayList的线程安全仍然没有保证，一般，保证ArrayList的线程安全可以通过这些方案：

使用 Vector 代替 ArrayList，虽然可以，但是不推荐，不推荐的原因如下：

Vector 是一个历史遗留类，它与 ArrayList 一样，都是基于数组实现的，不同的是 Vector 支持线程同步，即同一时刻只允许一个线程对于 Vector 进行写操作（增删改），以保证多线程环境下的数据一致性，但是需要频繁对 Vector 示例进行加锁和释放锁的操作，因此导致 Vector 的读写效率从整体上来说，远远比不是 ArrayList，所以不推荐使用。

使用 Collections.synchronizedList 包装 ArrayList，然后操作包装后的 list。
使用 CopyOnWriteArrayList 代替 ArrayList。
在使用 ArrayList 时，应用程序通过同步机制去控制 ArrayList 的读写。

7.CopyOnWriteArrayList了解多少？

CopyOnWriteArrayList就是线程安全版本的ArrayList。

它的名字叫 CopyOnWrite ——写时复制，已经明示了它的原理。

CopyOnWriteArrayList 采用了一种读写分离的并发策略。CopyOnWriteArrayList 容器允许并发读，读操作是无锁的，性能较高。至于写操作，比如向容器中添加一个元素，则首先将当前容器复制一份，然后在新副本上执行写操作，结束之后再将原容器的引用指向新容器。

8.Arraylist 和 Vector 的区别

ArrayList在内存不够时扩容为原来的1.5倍，Vector是扩容为原来的2倍。

Vector属于线程安全级别的，但是大多数情况下不使用Vector，因为操作Vector效率比较低。

9.怎么在遍历 ArrayList 时移除一个元素？

foreach删除会导致快速失败问题，可以使用迭代器的 remove() 方法。

Iterator itr = list.iterator();
while(itr.hasNext()) {
    if(itr.next().equals("jay") {
        itr.remove();
    }
}

Map

在Map中，毫无疑问最重要的就是HashMap，这个基本是面试中的必考点，所以需要重点准备！！！！

10.能说一下HashMap的数据结构吗？

这个问题需要分成两个阶段来进行回答，分别是 JDK 1.8 以前和 JDK 1.8 之后。

JDK 1.8 以前，采用的数据结构是数组 + 链表，但是 JDK1.8 及以前的版本还有人在用？应该没有吧 .........

接下来来盘一下 JDK 1.8 中 HashMap 的数据结构：

其采用的数据结构是数组 + 链表 + 红黑树。

数据结构如下图所示：

其中，桶数组是用来存储数据元素，链表是用来解决冲突，红黑树是为了提高查询的效率。

数据元素通过映射关系，也就是散列函数，映射到桶数组对应索引的位置
如果发生冲突，从冲突的位置拉一个链表，插入冲突的元素
如果链表长度>8&数组大小>=64，链表转为红黑树
如果红黑树节点个数>> 16))
判断tab是否位空或者长度为0，如果返回的是 true ，则进行扩容操作。

柒夭日志：Java集合框架

1. 说说有哪些常见集合，并且之间有什么区别？

2. ArrayList和LinkedList有什么区别？

3.ArrayList的扩容机制了解吗？

4.ArrayList怎么序列化的知道吗？为什么用transient修饰数组？

5.快速失败(fail-fast)和安全失败(fail-safe)了解吗？

6.有哪几种实现ArrayList线程安全的方法？

7.CopyOnWriteArrayList了解多少？

8.Arraylist 和 Vector 的区别

9.怎么在遍历 ArrayList 时移除一个元素？

10.能说一下HashMap的数据结构吗？

设计模式之代理模式：为对象提供一个“替身”

MyBatis查询数据库（3）

如何解决Java迭代器异常（IteratorException）

如何解决Java方法返回值无效错误异常（InvalidReturnValueErrorExceotion）

gnet：基于Go语言的高性能网络框架