本篇会解决一下几个问题:
1.堆是什么?
2.如何形成一个堆?
3.堆的应用场景
堆是什么?
- 堆总是一颗完全二叉树
- 堆的某个节点总是不大于或不小于父亲节点
如图,在小堆中,父亲节点总是小于孩子节点的。
如图,在大堆中,父亲节点总是大于孩子节点的。
堆和二叉树还是有很大区别的,堆是用数组来实现的,尽管逻辑结构上是一颗二叉树,但在内存上要比二叉树好,普通的二叉树,你要用链表来存储他们的左右孩子,还要给他们分配空间,但堆只是用数组来表示。
如何形成一个堆?
堆的创建有向上调整和向下调整两种方式。
向上调整:从第一个非叶子节点开始向上调整,一直调整到根节点。
用int a[] ={1,5,3,8,7,6};来做例子,
如图所示,
向下调整:从根节点开始,和左右孩子中小或者大的节点比较,交换,直到小于数组元素。
堆的插入
堆的删除
删除堆是删除堆顶的元素,将堆顶的元素根据最后一个数据一换,然后删除数组中最后一个元素,再进行向下调整算法。
这里想一想为什么要这样???
1.因为堆是有数组来创建的,如果直接删除堆顶的数据,第一个缺点就是会造成移动,从后往前覆盖,这样就会造成一个问题。兄弟节点变成父子节点,而且这样也不能很好的利用数组的优点。
2.如果是交换第一个和最后一个元素,这样有2个优点:
- 第一个是不会破坏除了堆顶的左右堆的结构。
- 第二个就是会利用数组的优点,数组读取速度很快,这样每次最后或最小的元素就放在了后面。
堆的时间复杂度
向下调整时间复杂度:
则要移动节点的总步数为:
向上调整时间复杂度:
则要调整的节点总数为:
堆的应用场景
- 堆排序,可以用堆的建立和堆的删除来实现排序,堆排序十分稳定(相同元素的相对位置不会发生交换),而且时间复杂度都是O(N*logN)
- TOP-K问题,我们想一想王者荣耀中前100的玩家是怎么实现的,或者专业前10名...问题
1).先回答一下TOP-K问题:即求数据结合中前K个最大的元素或最小的元素,一把情况下数据很大。
2).对于这种场景,首先想到的就是排序,但是:数据非常大,排序就不可取了,因为内存大小的原因,不会全部加载到内存,这时堆就发生了巨大的优势。
思路:利用K个元素建堆,如果是求最大的K个元素,就建立小堆,求最小的K歌元素,就建立大堆。然后用N-K个元素与堆顶元素比较,满足条件就交换。
下面是源码:
void HeapInit(Heap* php)
{assert(php);php->a = NULL;php->size = php->capacity =0;
}void HeapDestroy(Heap* php)
{assert(php);free(php->a);php->a = NULL;php->capacity = php->size =0;
}void Swap(HeapDateType* child, HeapDateType* parent){HeapDateType tmp = *child;*child= *parent;*parent = tmp;
}void AdjustUp(HeapDateType* a,int child){int parent = (child-1)/2;while(child > 0){if(a[child] < a[parent]){Swap(&a[child],&a[parent]);child = parent;parent = (child-1)/2;}else{break;}
}}void HeapPush(Heap* php,HeapDateType x)
{assert(php);if(php->size == php->capacity){int newCapacity = php->capacity == 0?4:php->capacity*2;HeapDateType* tmp = (HeapDateType*)realloc(php->a,sizeof(HeapDateType)*newCapacity);if(tmp == NULL){perror("realloc fail\n");}php->a = tmp;php->capacity = newCapacity;}php->a[php->size] = x;php->size++;AdjustUp(php->a,php->size-1);
}void HeapPrint(Heap* php)
{assert(php);for(size_t i =0; i<php->size; i++){std::cout << php->a[i] << " ";}std::cout << std::endl;
}void AdjustDown(HeapDateType* a,int n, int parent)
{int child = parent*2+1;while(child < n){if(child+1 < n && a[child+1] < a[child]){child++;}if(a[child] < a[parent]){Swap(&a[child],&a[parent]);parent = child;child = parent*2+1;}else{break;}}
}HeapDateType HeapTop(Heap* php)
{assert(php);assert(php->size > 0);return php->a[0];
}void HeapPop(Heap* php)
{assert(php);assert(php->size > 0);Swap(&php->a[0],&php->a[php->size-1]);--php->size;AdjustDown(php->a,php->size,0);}bool HeapEmpty(Heap* php)
{assert(php);return php->size == 0;
}
void HeapSort(int* a, int n)
{//向上调整 O(n*logn)
// for(size_t i =1; i<n; i++){
// AdjustUp(a,i);
// }
////向下调整 O(n)for(int i = (n-2)/2; i>=0; i--){AdjustDown(a,n,i);}//时间复杂度O(N*logN)int end = n-1;while(end > 0){Swap(&a[0],&a[end]);AdjustDown(a,end,0);--end;}
}void PrintTopK(const char* filename,int k)
{FILE* fout = fopen(filename,"r");if(fout == NULL){perror("fopen fail");exit(-1);}int* minHeap = (int*)malloc(sizeof(int)*k);if(minHeap == NULL){perror("malloc fail");exit(-1);}for(int i =0; i<k; i++){fscanf(fout,"%d",&minHeap[i]);}for(int i = (k-2)/2; i>=0; i++){AdjustDown(minHeap,k,0);}int x =0;while(fscanf(fout,"%d",&x)!= EOF){if(x > minHeap[0]){minHeap[0] = x;AdjustDown(minHeap,k,0);}}for(int i =0; i<k; i++){std::cout << minHeap[i] << " ";}std::cout << std::endl;
}