【Java 面试八股文】常见集合篇

常见集合篇

- 1. 常见集合有哪些
- 2. ArrayList底层实现的原理是什么？
- 3. ArrayList list=new ArrayList(10)中的list扩容几次
- 4. 如何实现数组和List之间的转换
- 5. ArrayList和LinkedList的区别是什么？
- 6. 说一下HashMap的实现原理？
- 7. HashMap的jdk1.7和jdk1.8有什么区别
- 8. 红黑树
- 9. HashMap的put方法的具体流程
- 10. 讲一讲HashMap的扩容机制
- 11. 为何HashMap的数组长度一定是2的次幂？
- 12. hashMap的寻址算法
- 13. HashSet与HashMap的区别
- 14. HashTable与HashMap的区别

1. 常见集合有哪些

ArrayList
LinkedList
HashMap
ConcurrentHashMap
ArrayList底层实现是数组
LinkedList底层实现是双向链表
HashMap的底层实现使用了众多数据结构，包含了数组、链表、散列表、红黑树等

2. ArrayList底层实现的原理是什么？

底层数据结构
ArrayList底层是用动态的数组实现的
初始容量
ArrayList初始容量为0，当第一次添加数据的时候才会初始化容量为10
扩容逻辑
ArrayList在进行扩容的时候是原来容量的1.5倍，每次扩容都需要拷贝数组
添加逻辑
- 确保数组已使用长度（size）加1之后足够存下下一个数据
- 计算数组的容量，如果当前数组已使用长度+1后的大于当前的数组长度，则调用grow方法扩容（原来的1.5倍）
- 确保新增的数据有地方存储之后，则将新元素添加到位于size的位置上。
- 返回添加成功布尔值。

在这里插入图片描述

3. ArrayList list=new ArrayList(10)中的list扩容几次

该语句只是声明和实例了一个 ArrayList，指定了容量为 10，未扩容
在这里插入图片描述

4. 如何实现数组和List之间的转换

数组转List ，使用JDK中 java.util.Arrays 工具类的 asList 方法
List转数组，使用List的 toArray 方法。无参toArray方法返回 Object数组，传入初始化长度的数组对象，返回该对象数组。
用Arrays.asList转List后，如果修改了数组内容，list受影响吗
- 受影响。因为它的底层使用的Arrays类中的一个内部类ArrayList来构造的集合，在这个集合的构造器中，把我们传入的这个集合进行了包装而已，最终指向的都是同一个内存地址。
List用toArray转数组后，如果修改了List内容，数组受影响吗
- 不影响。当调用了toArray以后，在底层是它是进行了数组的拷贝，跟原来的元素就没啥关系了，所以即使list修改了以后，数组也不受影响。

5. ArrayList和LinkedList的区别是什么？

底层数据结构
- ArrayList 是 动态数组 的数据结构实现
- LinkedList 是 双向链表 的数据结构实现
操作数据效率
- ArrayList按照下标查询的时间复杂度O(1)【内存是连续的，根据寻址公式】， LinkedList不支持下标查询
- 查找（未知索引）： ArrayList需要遍历，链表也需要遍历，时间复杂度都是O(n)
- 新增和删除
  - ArrayList尾部插入和删除，时间复杂度是O(1)；其他部分增删需要挪动数组，时间复杂度是O(n)
  - LinkedList头尾节点增删时间复杂度是O(1)，其他都需要遍历链表，时间复杂度是O(n)
内存空间占用
- ArrayList底层是数组，内存连续，节省内存
- LinkedList 是双向链表需要存储数据，和两个指针，更占用内存
线程安全
- ArrayList和LinkedList都不是线程安全的
- 如果需要保证线程安全，有两种方案：
  - 在方法内使用，局部变量则是线程安全的
  - 使用线程安全的ArrayList和LinkedList

6. 说一下HashMap的实现原理？

HashMap的数据结构：底层使用hash表数据结构，即数组和链表或红黑树

当我们往HashMap中put元素时，利用key的hashCode重新hash计算出当前对象的元素在数组中的下标
存储时，如果出现hash值相同的key，此时有两种情况。
a. 如果key相同，则覆盖原始值；
b. 如果key不同（出现冲突），则将当前的key-value放入链表或红黑树中
获取时，直接找到hash值对应的下标，在进一步判断key是否相同，从而找到对应值。

7. HashMap的jdk1.7和jdk1.8有什么区别

JDK1.8之前采用的是拉链法。拉链法：将链表和数组相结合。也就是说创建一个链表数组，数组中每一格就是一个链表。若遇到哈希冲突，则将冲突的值加到链表中即可。
jdk1.8在解决哈希冲突时有了较大的变化，当链表长度大于阈值（默认为8）时并且数组长度达到64时，将链表转化为红黑树，以减少搜索时间。扩容 resize( ) 时，红黑树拆分成的树的结点数小于等于临界值6个，则退化成链表。

8. 红黑树

红黑树（Red Black Tree）：也是一种自平衡的二叉搜索树(BST)，之前叫做平衡二叉B树（Symmetric Binary B-Tree）
在这里插入图片描述
红黑树的特质
性质1：节点要么是红色,要么是黑色
性质2：根节点是黑色
性质3：叶子节点都是黑色的空节点
性质4：红黑树中红色节点的子节点都是黑色
性质5：从任一节点到叶子节点的所有路径都包含相同数目的黑色节点
在添加或删除节点的时候，如果不符合这些性质会发生旋转，以达到所有的性质，保证红黑树的平衡

9. HashMap的put方法的具体流程

在这里插入图片描述

判断键值对数组table是否为空或为null，否则执行resize()进行扩容（初始化）
根据键值key计算hash值得到数组索引
判断table[i]==null，条件成立，直接新建节点添加
如果table[i]==null ,不成立
4.1 判断table[i]的首个元素是否和key一样，如果相同直接覆盖value
4.2 判断table[i] 是否为treeNode，即table[i] 是否是红黑树，如果是红黑树，则直接在树中插入键值对
4.3 遍历table[i]，链表的尾部插入数据，然后判断链表长度是否大于8，大于8的话把链表转换为红黑树，在红黑树中执行插入操作，遍历过程中若发现key已经存在直接覆盖value
插入成功后，判断实际存在的键值对数量size是否超多了最大容量threshold（数组长度*0.75），如果超过，进行扩容。

10. 讲一讲HashMap的扩容机制

在这里插入图片描述

在添加元素或初始化的时候需要调用resize方法进行扩容，第一次添加数据初始化数组长度为16，以后每次每次扩容都是达到了 扩容阈值（数组长度 * 0.75）
每次扩容的时候，都是扩容之前容量的2倍；
扩容之后，会新创建一个数组，需要把老数组中的数据挪动到新的数组中
- 没有hash冲突的节点，则直接使用 e.hash & (newCap - 1) 计算新数组的索引位置
- 如果是红黑树，走红黑树的添加
- 如果是链表，则需要遍历链表，可能需要拆分链表，判断 (e.hash & oldCap) 是否为0，该元素的位置要么停留在原始位置，要么移动到原始位置+增加的数组大小这个位置上

11. 为何HashMap的数组长度一定是2的次幂？

计算索引时效率更高：如果是 2 的 n 次幂可以使用位与运算代替取模
扩容时重新计算索引效率更高： hash & oldCap == 0 的元素留在原来位置，否则新位置 = 旧位置 + oldCap

12. hashMap的寻址算法

在这里插入图片描述
在putVal方法中，有一个hash(key)方法，这个方法就是来去计算key的hash值的，看下面的代码

首先获取key的hashCode值，然后右移16位异或运算原来的hashCode值，主要作用就是使原来的hash值更加均匀，减少hash冲突
有了hash值之后，就很方便的去计算当前key的在数组中存储的下标，看下面的代码：
在这里插入图片描述
(n-1)&hash : 得到数组中的索引，代替取模，性能更好，数组长度必须是2的n次幂

13. HashSet与HashMap的区别

HashSet实现了Set接口, 仅存储对象; HashMap实现了 Map接口, 存储的是键值对.
HashSet底层其实是用HashMap实现存储的, HashSet封装了一系列HashMap的方法. 依靠HashMap来存储元素值,(利用hashMap的key键进行存储), 而value值默认为Object对象. 所以HashSet也不允许出现重复值, 判断标准和HashMap判断标准相同, 两个元素的hashCode相等并且通过equals()方法返回true.