常见集合篇
- 1. 常见集合有哪些
- 2. ArrayList底层实现的原理是什么?
- 3. ArrayList list=new ArrayList(10)中的list扩容几次
- 4. 如何实现数组和List之间的转换
- 5. ArrayList和LinkedList的区别是什么?
- 6. 说一下HashMap的实现原理?
- 7. HashMap的jdk1.7和jdk1.8有什么区别
- 8. 红黑树
- 9. HashMap的put方法的具体流程
- 10. 讲一讲HashMap的扩容机制
- 11. 为何HashMap的数组长度一定是2的次幂?
- 12. hashMap的寻址算法
- 13. HashSet与HashMap的区别
- 14. HashTable与HashMap的区别
1. 常见集合有哪些
-
ArrayList
-
LinkedList
-
HashMap
-
ConcurrentHashMap
-
ArrayList底层实现是数组
-
LinkedList底层实现是双向链表
-
HashMap的底层实现使用了众多数据结构,包含了数组、链表、散列表、红黑树等
2. ArrayList底层实现的原理是什么?
- 底层数据结构
ArrayList底层是用动态的数组实现的 - 初始容量
ArrayList初始容量为0,当第一次添加数据的时候才会初始化容量为10 - 扩容逻辑
ArrayList在进行扩容的时候是原来容量的1.5倍,每次扩容都需要拷贝数组 - 添加逻辑
- 确保数组已使用长度(size)加1之后足够存下下一个数据
- 计算数组的容量,如果当前数组已使用长度+1后的大于当前的数组长度,则调用grow方法扩容(原来的1.5倍)
- 确保新增的数据有地方存储之后,则将新元素添加到位于size的位置上。
- 返回添加成功布尔值。
3. ArrayList list=new ArrayList(10)中的list扩容几次
该语句只是声明和实例了一个 ArrayList,指定了容量为 10,未扩容
4. 如何实现数组和List之间的转换
- 数组转List ,使用JDK中
java.util.Arrays
工具类的asList
方法 - List转数组,使用List的
toArray
方法。无参toArray方法返回 Object数组,传入初始化长度的数组对象,返回该对象数组。 - 用Arrays.asList转List后,如果修改了数组内容,list受影响吗
- 受影响。因为它的底层使用的Arrays类中的一个内部类ArrayList来构造的集合,在这个集合的构造器中,把我们传入的这个集合进行了包装而已,最终指向的都是同一个内存地址。
- List用toArray转数组后,如果修改了List内容,数组受影响吗
- 不影响。当调用了toArray以后,在底层是它是进行了数组的拷贝,跟原来的元素就没啥关系了,所以即使list修改了以后,数组也不受影响。
5. ArrayList和LinkedList的区别是什么?
- 底层数据结构
- ArrayList 是 动态数组 的数据结构实现
- LinkedList 是 双向链表 的数据结构实现
- 操作数据效率
- ArrayList按照下标查询的时间复杂度O(1)【内存是连续的,根据寻址公式】, LinkedList不支持下标查询
- 查找(未知索引): ArrayList需要遍历,链表也需要遍历,时间复杂度都是O(n)
- 新增和删除
- ArrayList尾部插入和删除,时间复杂度是O(1);其他部分增删需要挪动数组,时间复杂度是O(n)
- LinkedList头尾节点增删时间复杂度是O(1),其他都需要遍历链表,时间复杂度是O(n)
- 内存空间占用
- ArrayList底层是数组,内存连续,节省内存
- LinkedList 是双向链表需要存储数据,和两个指针,更占用内存
- 线程安全
- ArrayList和LinkedList都不是线程安全的
- 如果需要保证线程安全,有两种方案:
- 在方法内使用,局部变量则是线程安全的
- 使用线程安全的ArrayList和LinkedList
6. 说一下HashMap的实现原理?
HashMap的数据结构: 底层使用hash表数据结构,即数组和链表或红黑树
- 当我们往HashMap中put元素时,利用key的hashCode重新hash计算出当前对象的元素在数组中的下标
- 存储时,如果出现hash值相同的key,此时有两种情况。
a. 如果key相同,则覆盖原始值;
b. 如果key不同(出现冲突),则将当前的key-value放入链表或红黑树中 - 获取时,直接找到hash值对应的下标,在进一步判断key是否相同,从而找到对应值。
7. HashMap的jdk1.7和jdk1.8有什么区别
- JDK1.8之前采用的是拉链法。拉链法:将链表和数组相结合。也就是说创建一个链表数组,数组中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可。
- jdk1.8在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为8) 时并且数组长度达到64时,将链表转化为红黑树,以减少搜索时间。扩容 resize( ) 时,红黑树拆分成的树的结点数小于等于临界值6个,则退化成链表。
8. 红黑树
红黑树(Red Black Tree):也是一种自平衡的二叉搜索树(BST),之前叫做平衡二叉B树(Symmetric Binary B-Tree)
红黑树的特质
性质1:节点要么是红色,要么是黑色
性质2:根节点是黑色
性质3:叶子节点都是黑色的空节点
性质4:红黑树中红色节点的子节点都是黑色
性质5:从任一节点到叶子节点的所有路径都包含相同数目的黑色节点
在添加或删除节点的时候,如果不符合这些性质会发生旋转,以达到所有的性质,保证红黑树的平衡
9. HashMap的put方法的具体流程
- 判断键值对数组table是否为空或为null,否则执行resize()进行扩容(初始化)
- 根据键值key计算hash值得到数组索引
- 判断table[i]==null,条件成立,直接新建节点添加
- 如果table[i]==null ,不成立
4.1 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value
4.2 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对
4.3 遍历table[i],链表的尾部插入数据,然后判断链表长度是否大于8,大于8的话把链表转换为红黑树,在红黑树中执行插入操 作,遍历过程中若发现key已经存在直接覆盖value - 插入成功后,判断实际存在的键值对数量size是否超多了最大容量threshold(数组长度*0.75),如果超过,进行扩容。
10. 讲一讲HashMap的扩容机制
- 在添加元素或初始化的时候需要调用resize方法进行扩容,第一次添加数据初始化数组长度为16,以后每次每次扩容都是达到了 扩容阈值(数组长度 * 0.75)
- 每次扩容的时候,都是扩容之前容量的2倍;
- 扩容之后,会新创建一个数组,需要把老数组中的数据挪动到新的数组中
- 没有hash冲突的节点,则直接使用
e.hash & (newCap - 1)
计算新数组的索引位置 - 如果是红黑树,走红黑树的添加
- 如果是链表,则需要遍历链表,可能需要拆分链表,判断
(e.hash & oldCap)
是否为0,该元素的位置要么停留在原始位置,要么移动到原始位置+增加的数组大小这个位置上
- 没有hash冲突的节点,则直接使用
11. 为何HashMap的数组长度一定是2的次幂?
- 计算索引时效率更高:如果是 2 的 n 次幂可以使用位与运算代替取模
- 扩容时重新计算索引效率更高: hash & oldCap == 0 的元素留在原来位置 ,否则新位置 = 旧位置 + oldCap
12. hashMap的寻址算法
在putVal方法中,有一个hash(key)方法,这个方法就是来去计算key的hash值的,看下面的代码
首先获取key的hashCode值,然后右移16位 异或运算 原来的hashCode值,主要作用就是使原来的hash值更加均匀,减少hash冲突
有了hash值之后,就很方便的去计算当前key的在数组中存储的下标,看下面的代码:
(n-1)&hash : 得到数组中的索引,代替取模,性能更好,数组长度必须是2的n次幂
13. HashSet与HashMap的区别
- HashSet实现了Set接口, 仅存储对象; HashMap实现了 Map接口, 存储的是键值对.
- HashSet底层其实是用HashMap实现存储的, HashSet封装了一系列HashMap的方法. 依靠HashMap来存储元素值,(利用hashMap的key键进行存储), 而value值默认为Object对象. 所以HashSet也不允许出现重复值, 判断标准和HashMap判断标准相同, 两个元素的hashCode相等并且通过equals()方法返回true.
14. HashTable与HashMap的区别
在实际开中不建议使用HashTable,在多线程环境下可以使用ConcurrentHashMap类