目录
哈希冲突
哈希冲突-避免方式1-哈希函数的设计
1. 直接定制法--(常用)
2. 除留余数法--(常用)
3. 平方取中法--(了解)
哈希冲突-避免方式2-负载因子调节
哈希冲突-解决方式1-闭散列
1.线性探测
2.二次探测
哈希冲突-解决方式2-开散列(哈希桶)
哈希冲突
在上文中我们介绍过哈希表在使用时因为表空间的大小有限,不同关键字在通过相同哈希函数计算时很可能计算出相同的哈希地址,这种现象我们称为哈希冲突或哈希碰撞。我们哈希表底层数组的容量往往是小于实际要存储的关键字的数量的,这就导致一个问题,冲突的发生是必然的,但我们能做的应该是尽量的降低冲突率。
我们将降低冲突率的方式大概分为两大类,一类是通过前期合理的设计,尽可能的避免哈希冲突的发生,一类是在哈希冲突发生后想办法去存储原来的数值减少哈希冲突带来的危害。
哈希冲突-避免方式1-哈希函数的设计
为了避免哈希冲突,我们要让哈希函数尽可能的合理,哈希函数设计有以下原则:
- 哈希函数的定义域必须包括需要存储的全部关键码,如果散列表有m个地址时,其值域必须在0到m-1之间
- 哈希函数计算出来的地址能均匀分布在整个空间中
- 哈希函数应该比较简单
常见哈希函数:
1. 直接定制法--(常用)
2. 除留余数法--(常用)
3. 平方取中法--(了解)
哈希冲突-避免方式2-负载因子调节
什么是负载因子?
负载因子是评估哈希冲突发生概率的一个指标,范围在0-1之间,越接近1,发生哈希冲突的概率越高,定义为α=填入表中的元素个数 / 散列表的长度。
对于开放定址法,在我们设计的哈希表中我们需要严格监控负载因子的大小,应该严格限制在0.7-0.8以下,比如Java的系统库限制了负载因子的大小严格为0.75,当负载因子过高时我们可以通过增大哈希表的数组大小来调整负载因子。
哈希冲突-解决方式1-闭散列
1.线性探测
2.二次探测
哈希冲突-解决方式2-开散列(哈希桶)
// key-value 模型
public class HashBucket {
private static class Node {
private int key;
private int value;
Node next;
public Node(int key, int value) {
this.key = key;
this.value = value;
}
}
private Node[] array;
private int size; // 当前的数据个数
private static final double LOAD_FACTOR = 0.75;
public int put(int key, int value) {
int index = key % array.length;
// 在链表中查找 key 所在的结点
// 如果找到了,更新
// 所有结点都不是 key,插入一个新的结点
for (Node cur = array[index]; cur != null; cur = cur.next) {
if (key == cur.key) {
int oldValue = cur.value;
cur.value = value;
return oldValue;
}
}
Node node = new Node(key, value);
node.next = array[index];
array[index] = node;
size++;
if (loadFactor() >= LOAD_FACTOR) {
resize();
}
return -1;
}
private void resize() {
Node[] newArray = new Node[array.length * 2];
for (int i = 0; i < array.length; i++) {
Node next;
for (Node cur = array[i]; cur != null; cur = next) {
next = cur.next;
int index = cur.key % newArray.length;
cur.next = newArray[index];
newArray[index] = cur;
}
}
array = newArray;
}
private double loadFactor() {
return size * 1.0 / array.length;
}
public HashBucket() {
array = new Node[8];
size = 0;
}
public int get(int key) {
int index = key % array.length;
Node head = array[index];
for (Node cur = head; cur != null; cur = cur.next) {
if (key == cur.key) {
return cur.value;
}
}
return -1;
}
}
哈希表最大优势就是插入/删除/查找的时间复杂度都是O(1)。
主页已更新完Java基础内容,数据结构基础,
正在更新算法篇,数据库篇,
未来会更新Java项目,SpringBoot,Redis以及各种Java路线会用到的技术。
求点赞!求收藏!求评论!求关注!
谢谢大家!!!!!!!!!