哈希与unordered_set、unordered_map(C++)

目录

1. unordered系列关联式容器

1.1.unordered_map的接口示例

1.2. 底层结构

 底层差异

哈希概念

2.哈希表的模拟实现

3.unordered的封装 

3.1.哈希表的改造

3.2.上层封装 

3.2.1.unordered_set封装

3.2.2.unordered_map封装及operator[]实现


1. unordered系列关联式容器

在C++11中,STL又提供了4个unordered系列的关联式容器:

unordered_set

unordered_multiset

unordered_map

unordered_multimap

这四个容器与红黑树结构的关联式容器使用方式基本类似,只是其底层结构不同,他们的底层为哈希表。

1.1.unordered_map的接口示例

下面给出unordered_map常用的一些函数

1).unordered_map的构造

函数声明功能简介
(constructor)构造的unordered_map对象        

 2).unordered_map的容量

函数声明功能简介

empty

返回容器是否为空

size
返回容器中储存元素个数

3).unordered_map的修改操作

函数声明功能简介
operator[]访问指定key元素,若没有则插入
insert插入元素
erase删除指定key元素
clear清除内容

 4).unordered_map的查询操作

函数声明功能简介

iterator find(const key_type& k)

查找指定key元素,返回其迭代器

size_type count (const key_type& k)

返回哈希桶中关键码为key的键值对的个数

  5).unordered_map的迭代器

函数声明功能简介
begin返回unordered_map第一个元素的迭代器
end返回unordered_map最后一个元素下一个位置的迭代器
cbegin返回unordered_map第一个元素的const迭代器
cend返回unordered_map最后一个元素下一个位置的const迭代器

1.2. 底层结构

unordered系列的关联式容器之所以效率比较高,是因为其底层使用了哈希结构。

底层差异

1.对key的要求不同

   set:key支持比较大小

   unordered_set:key支持转成整型+比较相等

2.set遍历有序,unordered_set遍历无序

3.性能差异(查找的时间复杂度)

   set:O(logN)

   unordered_set:O(1)

哈希概念

构造一种存储结构,通过某种函数(hashFunc)使元素的存储位置与它的关键码之间能够建立 一一映射的关系,那么在查找时通过该函数可以很快找到该元素。

哈希思想即为将关键码与储存位置进行映射。

 ○插入元素时根据待插入元素的关键码,以此函数计算出该元素的存储位置并按此位置进行存放

○搜索元素时对元素的关键码进行同样的计算,把求得的函数值当做元素的存储位置,在结构中按此位置取元素比较,若关键码相等,则搜索成功

该方式即为哈希(散列)方法,哈希方法中使用的转换函数称为哈希(散列)函数,构造出来的结构称 为哈希表(Hash Table)(或者称散列表)

建立映射关系有下面两种方法

1.直接定址法

   优点:快、没有哈希冲突

   缺点:只适合范围相对集中关键码,否则要牺牲空间为代价

2.除留余数法

   hash(key) = key % capacity

哈希冲突/碰撞:不同关键字通过哈希函数计算后映射到了相同位置

如何解决哈希冲突?

1.开散列:开放定址法——按某种规则去其他位置找一个空位置储存(a.线性探测;b.二次探测)

2.闭散列:哈希桶/拉链法——首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。

2.哈希表的模拟实现

下面给出哈希表的模拟实现

HashFunc是将关键码转为整型的仿函数

//在哈希表中定义负载因子,用于记录哈希表中存储数据个数

size_t _n;

//当_n / _tables.size() 达到一定程度后对哈希表进行扩容

//负载因子过高,进行扩容
            if (_n * 10 / _tables.size() >= 10)
            {
                HashTable<K, T, KeyOfT> newtable;
                int newsize = _tables.size() * 2;
                newtable._tables.resize(newsize);

                for (auto& e : _tables)
                {
                    Node* del = e;
                    while (e)
                    {
                        newtable.Insert(e->_data);
                        e = e->_next;
                    }
                    del = nullptr;
                }

                //调用自己类Insert遵循规则插入新表,最后交换
                _tables.swap(newtable._tables);
            }

// 哈希函数采用除留余数法
template<class K>
struct HashFunc
{size_t operator()(const K& key){return (size_t)key;}
};// 哈希表中支持字符串的操作
template<>
struct HashFunc<string>
{size_t operator()(const string& key){size_t hash = 0;for (auto e : key){//*31减小冲突的可能hash *= 31;hash += e;}return hash;}
};// 以下采用开放定址法,即线性探测解决冲突
namespace open_address
{//用枚举体表示表中相应位置状态:存在元素、空、元素删除位置enum State{EXIST,EMPTY,DELETE};template<class K, class V>struct HashData{pair<K, V> _kv;State _state = EMPTY;};template<class K, class V, class Hash = HashFunc<K>>class HashTable{public:HashTable():_n(0){_tables.resize(10);}bool Insert(const pair<K, V>& kv){if (Find(kv.first)){return false;}//负载因子过高,进行扩容if (_n * 10 / _tables.size() >= 7){HashTable<K, V> newtable;int newsize = _tables.size() * 2;newtable._tables.resize(newsize);for (auto e : _tables){if (e._state == EXIST){newtable.Insert(e._kv);}}//调用自己类Insert遵循规则插入新表,最后交换_tables.swap(newtable._tables);}Hash hashfun;int hashi = hashfun(kv.first) % _tables.size();//找非空或删除位置while (_tables[hashi]._state == EXIST){hashi++;hashi %= _tables.size();}_tables[hashi]._kv = kv;_tables[hashi]._state = EXIST;++_n;return true;}HashData<K, V>* Find(const K& key){Hash hashfun;int hashi = hashfun(key) % _tables.size();//DELETE位置也要查找,因为相同映射的元素在中间会被删除while (_tables[hashi]._state == EXIST || _tables[hashi]._state == DELETE){if (_tables[hashi]._state == EXIST && _tables[hashi]._kv.first == key){return &_tables[hashi];}hashi++;hashi %= _tables.size();}return nullptr;}bool Erase(const K& key){//直接复用查找后删除HashData<K, V>* pdata = Find(key);if (pdata == nullptr){return false;}pdata->_state = DELETE;--_n;return true;}private:vector<HashData<K, V>> _tables;size_t _n = 0;  // 表中存储数据个数};
}//哈希桶/拉链法
namespace hash_bucket
{template<class K, class V>struct HashNode{pair<K, V> _kv;HashNode<K, V>* _next;HashNode(const pair<K, V>& kv):_kv(kv), _next(nullptr){}};// Hash将key转化为整形,因为哈希函数使用除留余数法template<class K, class V, class Hash = HashFunc<K>>class HashTable{typedef HashNode<K, V> Node;public:HashTable(){_tables.resize(10, nullptr);}// 哈希桶的销毁//~HashTable();// 插入值为data的元素,如果data存在则不插入bool Insert(const pair<K, V>& kv){if (Find(kv.first)){return false;}//负载因子过高,进行扩容if (_n * 10 / _tables.size() >= 10){HashTable<K, V> newtable;int newsize = _tables.size() * 2;newtable._tables.resize(newsize);for (auto& e : _tables){while (e){newtable.Insert(e->_kv);e = e->_next;}}//调用自己类Insert遵循规则插入新表,最后交换_tables.swap(newtable._tables);}Hash hashfun;int hashi = hashfun(kv.first) % _tables.size();Node* newnode = new Node(kv);newnode->_next = _tables[hashi];_tables[hashi] = newnode;++_n;return true;}// 在哈希桶中查找值为key的元素,存在返回true否则返回falsebool Find(const K& key){Hash hashfun;int hashi = hashfun(key) % _tables.size();Node* cur = _tables[hashi];while (cur){if (cur->_kv.first == key){return true;}cur = cur->_next;}return false;}// 哈希桶中删除key的元素,删除成功返回true,否则返回falsebool Erase(const K& key){Hash hashfun;int hashi = hashfun(key) % _tables.size();Node* cur = _tables[hashi];Node* parent = nullptr;while (cur){if (cur->_kv.first == key){Node* next = cur->_next;if (cur == _tables[hashi]){_tables[hashi] = next;}else{parent->_next = next;}delete cur;--_n;return true;}parent = cur;cur = cur->_next;}return false;}private:vector<Node*> _tables;  // 指针数组size_t _n = 0;			// 表中存储数据个数};
}

3.unordered的封装 

封装unordered应按照以下步骤进行

1.实现哈希表

2.封装unordered_set、unordered_map,解决KeyOfT问题(取出数据类型中的关键码)

3.实现Iterator

4.operator[]的实现

3.1.哈希表的改造

上面我们已经实现了哈希表,下面我们对哈希表进行改造:解决KeyOfT问题、实现Iterator

//哈希桶/拉链法
namespace hash_bucket
{template<class T>struct HashNode{T _data;HashNode<T>* _next;HashNode(const T& data):_data(data), _next(nullptr){}};//前置哈希表声明template<class K, class T, class KeyOfT, class Hash>class HashTable;//哈希表迭代器template<class K,class T,class Ptr,class Ref,class KeyOfT,class Hash = HashFunc<K>>struct HashTableIterator{typedef HashNode<T> Node;typedef HashTable<K, T, KeyOfT,Hash> HashBucket;typedef HashTableIterator Self;HashTableIterator(Node* node,const HashTable<K, T, KeyOfT,Hash>* pht):_node(node), _pht(pht){}Self& operator++(){Hash hashfun;KeyOfT kot;Node* cur = _node;if (_node->_next){_node = _node->_next;}else{int hashi = hashfun(kot(cur->_data)) % _pht->_tables.size();++hashi;while (hashi < _pht->_tables.size() && _pht->_tables[hashi] == nullptr){++hashi;}if (hashi >= _pht->_tables.size()){_node = nullptr;return *this;}_node = _pht->_tables[hashi];}return  *this;}Ref operator*(){return _node->_data;}Ptr operator->(){return &_node->_data;}//因为end()返回为一个临时对象,必须加constbool operator!=(const Self& ito){return _node != ito._node;}Node* _node;const HashBucket* _pht;};// Hash将key转化为整形,因为哈希函数使用除留余数法template<class K, class T, class KeyOfT, class Hash = HashFunc<K>>class HashTable{public:typedef HashNode<T> Node;typedef HashTableIterator<K, T,T*, T&, KeyOfT> Iterator;typedef HashTableIterator<K, T,const T*,const T&, KeyOfT> ConstIterator;template<class K, class T, class KeyOfT,  class Ptr, class Ref, class Hash>friend struct HashTableIterator;public:HashTable(){_tables.resize(10, nullptr);}// 哈希桶的销毁~HashTable(){int hashi = 0;Node* cur;Node* next;while (hashi < _tables.size()){cur = _tables[hashi];while (cur){next = cur->_next;delete cur;cur = next;}++hashi;}}Iterator Begin(){if (_n == 0)return End();int hashi = 0;while (hashi <= _tables.size() && _tables[hashi] == nullptr){++hashi;}if (hashi >= _tables.size()){return Iterator(nullptr, this);}else{return Iterator(_tables[hashi],this);}}Iterator End(){return Iterator(nullptr, this);}ConstIterator Begin()const{int hashi = 0;while (hashi <= _tables.size() && _tables[hashi] == nullptr){++hashi;}if (hashi >= _tables.size()){return ConstIterator(nullptr, this);}else{return ConstIterator(_tables[hashi],this);}}ConstIterator End()const{return ConstIterator(nullptr, this);}// 插入值为data的元素,如果data存在则不插入pair<Iterator,bool> Insert(const T& data){KeyOfT kot;Iterator ret(nullptr,this);ret = Find(kot(data));if (ret._node != nullptr){return make_pair(ret,false);}//负载因子过高,进行扩容if (_n * 10 / _tables.size() >= 10){HashTable<K, T, KeyOfT> newtable;int newsize = _tables.size() * 2;newtable._tables.resize(newsize);for (auto& e : _tables){Node* del = e;while (e){newtable.Insert(e->_data);e = e->_next;}del = nullptr;}//调用自己类Insert遵循规则插入新表,最后交换_tables.swap(newtable._tables);}Hash hashfun;int hashi = hashfun(kot(data)) % _tables.size();Node* newnode = new Node(data);newnode->_next = _tables[hashi];_tables[hashi] = newnode;ret._node = newnode;++_n;return make_pair(ret,true);}// 在哈希桶中查找值为key的元素,存在返回true否则返回falseIterator Find(const K& key){KeyOfT kot;Hash hashfun;int hashi = hashfun(key) % _tables.size();Node* cur = _tables[hashi];while (cur){if (kot(cur->_data) == key){return Iterator(cur,this);}cur = cur->_next;}return Iterator(nullptr,this);}// 哈希桶中删除key的元素,删除成功返回true,否则返回falsebool Erase(const K& key){KeyOfT kot;Hash hashfun;int hashi = hashfun(key) % _tables.size();Node* cur = _tables[hashi];Node* parent = nullptr;while (cur){if (kot(cur->_data) == key){Node* next = cur->_next;if (cur == _tables[hashi]){_tables[hashi] = next;}else{parent->_next = next;}delete cur;--_n;return true;}parent = cur;cur = cur->_next;}return false;}private:vector<Node*> _tables;  // 指针数组size_t _n = 0;			// 表中存储数据个数};}

3.2.上层封装 

然后我们对unordered_set、unordered_map完成封装,unordered_map实现operator[]

3.2.1.unordered_set封装

namespace bit
{using namespace hash_bucket;template<class K>class unorderded_set{public:struct setKeyOfT{const K& operator()(const K& key){return key;}};typedef typename HashTable<K,const K, setKeyOfT>::Iterator iterator;typedef typename HashTable<K,const K, setKeyOfT>::ConstIterator const_iterator;pair<iterator, bool> insert(const K& data){return _pht.Insert(data);}bool erase(const K& key){return _pht.Erase(key);}iterator find(const K& key){return _pht.Find(key);}iterator begin(){return _pht.Begin();}iterator end(){return _pht.End();}const_iterator begin()const{return _pht.Begin();}const_iterator end()const{return _pht.End();}private:HashTable<K,const K, setKeyOfT> _pht;};
}

3.2.2.unordered_map封装及operator[]实现

operator[]实现需注意下层迭代器及Insert的实现

namespace bit
{template<class K, class V>class unorderded_map{public:struct mapKeyOfT{const K& operator()(const pair<K, V>& t){return t.first;}};typedef typename HashTable<K, pair<const K,V>, mapKeyOfT>::Iterator iterator;typedef typename HashTable<K, pair<const K, V>, mapKeyOfT>::ConstIterator const_iterator;pair<iterator, bool> insert(const pair<K,V>& data){return _pht.Insert(data);}bool erase(const K& key){return _pht.Erase(key);}iterator find(const K& key){return _pht.Find(key);}//要点在于下层迭代器及Insert的实现V& operator[](const K& key){pair<iterator, bool>  pa = insert(make_pair(key, V()));return pa.first->second;}iterator begin(){return _pht.Begin();}iterator end(){return _pht.End();}const_iterator begin()const{return _pht.Begin();}const_iterator end()const{return _pht.End();}private:hash_bucket::HashTable<K, pair<const K,V>, mapKeyOfT> _pht;};

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/465785.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言 循环高级

时间&#xff1a;2024.11.6 一、学习内容 1、无限循环 无限循环&#xff1a;循环永远停不下来 注意点&#xff1a;无限循环因为永远停不下来&#xff0c;所以下面不能再写其他的代码了 2、break 跳转控制语句&#xff1a; 在循环的过程中&#xff0c;跳到其他语句上执行 #…

易语言模拟真人动态生成鼠标滑动路径

一.简介 鼠标轨迹算法是一种模拟人类鼠标操作的程序&#xff0c;它能够模拟出自然而真实的鼠标移动路径。 鼠标轨迹算法的底层实现采用C/C语言&#xff0c;原因在于C/C提供了高性能的执行能力和直接访问操作系统底层资源的能力。 鼠标轨迹算法具有以下优势&#xff1a; 模拟…

CSS学习之Grid网格布局基本概念、容器属性

网格布局 网格布局&#xff08;Grid&#xff09;是将网页划分成一个个网格单元&#xff0c;可任意组合不同的网格&#xff0c;轻松实现各种布局效果&#xff0c;也是目前CSS中最强大布局方案&#xff0c;比Flex更强大。 基本概念 容器和项目 当一个 HTML 元素将 display 属性…

聊一聊Elasticsearch的索引的分片分配机制

1、什么是分片分配 分片分配是由ES主节点将索引分片移动到ES集群中各个节点上的过程。 该过程尽量保证&#xff0c;同一个索引的分片尽量分配到更多的节点上&#xff0c;以此来达到读写索引的时候可以利用更多硬件资源的效果。 在分配过程当中&#xff0c;也不能将某个主分片…

springboot的增删改查商城小实践(b to c)

首先准备一张表&#xff0c;根据业务去设计表 订单编号是参与业务的&#xff0c;他那订单编号里面是有特殊意义的&#xff0c;比如说像什么一些年月日什么的&#xff0c;一些用户的ID都在那编号里面呢&#xff1f;不能拿这种东西当主件啊 根据数据量去决定数据类型 价格需要注意…

Ubuntu 安装 RTL8811cu 网卡驱动

一、支持的网卡 RTL8811AU、RTL8811CU、RTL8821AU、RTL8821CU 二、下载驱动 github&#xff1a;https://github.com/brektrou/rtl8821CU 直接下载zip源码即可 三、安装驱动 sudo su -i #切换到root用户 apt-get update #更新安装源 apt-get install -y dkms …

解锁炎症和肿瘤免疫治疗新靶点:TREM1&TREM2

前 言 TREM家族属于细胞表面受体&#xff0c;介导调控炎症反应&#xff0c;现已成为癌症、神经退行性疾病以及炎症性疾病等多种疾病最有潜力的药物靶点。截至2023年6月&#xff0c;有5项FDA注册的临床前或临床试验正在进行中&#xff0c;有3项是TREM2在阿尔茨海默症&#xff…

【Unity】Unity拖拽在Android设备有延迟和卡顿问题的解决

一、介绍 在制作Block类游戏时&#xff0c;其核心的逻辑就是拖拽方块放入到地图中&#xff0c;这里最先想到的就是Unity的拖拽接口IDragHandler,然后通过 IPointerDownHandler, IPointerUpHandler 这两个接口判断按下和松手&#xff0c;具体的实现逻辑就是下面 public void On…

Postman断言与依赖接口测试详解!

在接口测试中&#xff0c;断言是不可或缺的一环。它不仅能够自动判断业务逻辑的正确性&#xff0c;还能确保接口的实际功能实现符合预期。Postman作为一款强大的接口测试工具&#xff0c;不仅支持发送HTTP请求和接收响应&#xff0c;还提供了丰富的断言功能&#xff0c;帮助测试…

NewStar CTF 2024 misc WP

decompress 压缩包套娃&#xff0c;一直解到最后一层&#xff0c;将文件提取出来 提示给出了一个正则&#xff0c;按照正则爆破密码&#xff0c;一共五位&#xff0c;第四位是数字 ^([a-z]){3}\d[a-z]$ 一共就五位数&#xff0c;直接ARCHPR爆破&#xff0c;得到密码 xtr4m&…

鸿蒙开发案例:七巧板

【1】引言&#xff08;完整代码在最后面&#xff09; 本文介绍的拖动七巧板游戏是一个简单的益智游戏&#xff0c;用户可以通过拖动和旋转不同形状的七巧板块来完成拼图任务。整个游戏使用鸿蒙Next框架开发&#xff0c;利用其强大的UI构建能力和数据响应机制&#xff0c;实现了…

C++_STL_xx_番外01_关于STL的总结(常见容器的总结;关联式容器分类及特点;二叉树、二叉搜索树、AVL树(平衡二叉搜索树)、B树、红黑树)

文章目录 1. 常用容器总结2. 关联式容器分类3. 二叉树、二叉搜索树、AVL树、B树、红黑树 1. 常用容器总结 针对常用容器的一些总结&#xff1a; 2. 关联式容器分类 关联式容器分为两大类&#xff1a; 基于红黑树的set和map&#xff1b;基于hash表的unorder_set和unorder_ma…

Django目录结构最佳实践

Django项目目录结构 项目目录结构配置文件引用修改创建自定义子应用方法修改自定义注册目录从apps目录开始 项目目录结构 └── backend # 后端项目目录&#xff08;项目名称&#xff09;├── __init__.py├── logs # 项目日志目录├── manage.py #…

AnytimeCL:难度加大,支持任意持续学习场景的新方案 | ECCV‘24

来源&#xff1a;晓飞的算法工程笔记 公众号&#xff0c;转载请注明出处 论文: Anytime Continual Learning for Open Vocabulary Classification 论文地址&#xff1a;https://arxiv.org/abs/2409.08518论文代码&#xff1a;https://github.com/jessemelpolio/AnytimeCL 创新…

2020年美国总统大选数据分析与模型预测

数据集取自&#xff1a;2020年&#x1f1fa;&#x1f1f8;&#x1f1fa;&#x1f1f8;美国大选数据集 - Heywhale.com 前言 对2020年美国总统大选数据的深入分析&#xff0c;提供各州和县层面的投票情况及选民行为的可视化展示。数据预处理阶段将涉及对异常值的处理&#xff0…

工业以太网PLC无线网桥,解决用户布线难题!

工业以太网无线网桥 功能概述 本产品是工业以太网(Profinet、EtherNet/IP、ModbusTCP等)转无线设备,成对使用(一对一),出厂前已经配对好,用户不需要再配对,即插即用。适用于用户布线不方便的场景。使用方式简单,只需要把拨码开关设置好并上电即可工作,无需进行其它设置。支持P…

Android13 系统/用户证书安装相关分析总结(三) 增加安装系统证书的接口遇到的问题和坑

一、前言 接上回说到&#xff0c;修改了程序&#xff0c;增加了接口&#xff0c;却不知道有没有什么问题&#xff0c;于是心怀忐忑等了几天。果然过了几天&#xff0c;应用那边的小伙伴报过来了问题。用户证书安装没有问题&#xff0c;系统证书(新增的接口)还是出现了问题。调…

AUTOSAR CP NVRAM Manager规范导读

一、NVRAM Manager功能概述 NVRAM Manager是AUTOSAR(AUTomotive Open System ARchitecture)框架中的一个模块,负责管理非易失性随机访问存储器(NVRAM)。它提供了一组服务和API,用于在汽车环境中存储、维护和恢复NV数据。以下是NVRAM Manager的一些关键功能: 数据存储和…

kelp protocol

道阻且长,行而不辍,未来可期 有很长一段时间我都在互联网到处拾金,but,东拼西凑的,总感觉不踏实,最近在老老实实的看官方文档 & 阅读白皮书 &看合约,挑拣一些重要的部分配上官方的证据,和过路公主or王子分享一下,愿我们早日追赶上公司里那些可望不可及大佬们。…

LeetCode25:K个一组翻转链表

原题地址&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; 题目描述 给你链表的头节点 head &#xff0c;每 k 个节点一组进行翻转&#xff0c;请你返回修改后的链表。 k 是一个正整数&#xff0c;它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍&#xff0c;那…