【Go语言精进之路】构建高效Go程序:了解map实现原理并高效使用

在这里插入图片描述

🔥 个人主页:空白诗
🔥 热门专栏:【Go语言精进之路】

在这里插入图片描述

文章目录

    • 引言
    • 一、什么是`map`
      • 1.1 `map`的基本概念与特性
      • 1.2 map的初始化与零值问题
      • 1.3 `map`作为引用类型的行为
    • 二、`map`的基本操作
      • 2.1 插入数据
      • 2.2 获取数据个数
      • 2.3 查找和数据读取
      • 2.4 删除数据
      • 2.5 遍历数据
    • 三、map的内部实现
      • 3.1 初始状态
      • 3.2 `map`扩容
      • 3.3 `map`并发
    • 四、尽量使用cap参数创建map
    • 五、总结

在这里插入图片描述

引言

在Go语言中,map 是一种无序的键值对集合,它以其高效的查找、插入和删除操作而闻名。了解 map 的基本概念、特性和内部实现机制,对于编写高效且稳定的Go代码至关重要。本文将深入探讨 map 的各个方面,包括其初始化、基本操作、内部实现细节,并讨论为何在创建 map 时应尽量使用带有容量提示参数的做法。


一、什么是map

在这里插入图片描述

1.1 map的基本概念与特性

map是Go语言中的一种内建引用类型,它表示一组无序的键值对集合。每个键值对用冒号“:”分隔,其中键(key)是唯一的,用于标识对应的值(value)。map允许我们根据特定的键快速检索、更新或删除对应的值。

在Go语言中,map对值(value)的数据类型没有特定限制,它可以是任意类型,包括基本类型、结构体、自定义类型等。但是,键(key)的类型有严格要求:key的类型必须可以通过“==”和“!=”操作符进行比较,这意味着键的类型需要是可比较的。因此,像函数、map和切片这样不可比较的类型不能作为map的键

1.2 map的初始化与零值问题

需要注意的是,map类型不支持“零值可用”,也就是说,未显式初始化的map变量其默认值为nil。尝试对nilmap变量进行操作将会导致运行时错误(panic)。例如:

var m map[string]int  // 此时m的值为nil
// 下面的操作将会导致运行时panic,因为m未被初始化
m["key"] = 1 // panic: assignment to entry in nil map

为了避免这种情况,我们需要在使用map之前对其进行初始化。可以通过以下两种方式之一来初始化map

  1. 使用make函数初始化:
m := make(map[string]int)
m["key"] = 1 // 现在这是安全的,因为m已经被初始化
  1. 使用字面量初始化:
m := map[string]int{"key": 1}
// 或者
m := map[string]int{}
m["key"] = 1 // 同样是安全的,因为m已经被初始化

初始化后的map可以被安全地用于存储和检索键值对,而不会导致运行时错误。在Go程序中,map是非常有用的数据结构,特别适用于需要根据键快速查找、添加或删除相应值的场景。

1.3 map作为引用类型的行为

和切片一样,map也是引用类型。这意味着,当你将一个map类型的变量传递给函数时,实际上传递的是指向底层数据结构的指针,而不是整个数据结构的拷贝。因此,将map类型变量作为函数参数传入不会有很大的性能消耗。

此外,由于在函数内部和外部引用的是同一个底层数据结构,所以在函数内部对map变量的修改(如添加、删除键值对或更新值)在函数外部也是可见的。这种特性使得map在需要在多个函数或方法间共享和修改数据时非常有用。

以下是一个示例,展示了在函数内部修改map,并在函数外部观察到这些修改:

package mainimport "fmt"func modifyMap(m map[string]int) {// 在函数内部修改mapm["apple"] = 5m["banana"] = 10
}func main() {// 初始化一个mapfruitMap := make(map[string]int)// 调用函数,传入map作为参数modifyMap(fruitMap)// 打印修改后的map,可以看到在modifyMap函数中所做的修改fmt.Println(fruitMap) // 输出: map[apple:5 banana:10]
}

在这个例子中,modifyMap函数接收一个map作为参数,并在函数内部添加了两个键值对。当函数执行完毕后,main函数中的fruitMap已经被修改,反映了modifyMap函数中所做的更改。这是因为map是引用类型,modifyMap接收的是fruitMap的引用,因此对它的任何修改都会反映在原始map上。


二、map的基本操作

在这里插入图片描述

2.1 插入数据

当面对一个非nilmap类型变量时,我们可以向其中插入符合map类型定义的任意键值对。值得注意的是,如果试图插入的键(key)已经存在于map中,那么新的值将会覆盖旧的值。Go运行时会管理map内部的内存,因此,除非系统内存耗尽,否则我们不必担心向map中插入大量数据。

m := make(map[string]int)
m["apple"] = 5  // 插入键值对 "apple": 5
m["apple"] = 7  // 更新键 "apple" 的值为 7,旧值5被覆盖
m["banana"] = 10 // 插入键值对 "banana": 10

在上述代码中,我们首先创建了一个从string类型到int类型的map。然后,我们插入了键值对"apple": 5。紧接着,我们尝试再次插入键"apple",但这次赋予它一个新的值7。由于这个键已经存在于map中,因此旧的值5会被新的值7覆盖。最后,我们插入了一个新的键值对"banana": 10

这种覆盖行为是map的一个重要特性,它允许我们根据需要更新存储在map中的值。在实际编程中,这一特性非常有用,比如当我们需要根据某些条件动态改变值时。

2.2 获取数据个数

要获取map中数据的个数,可以使用内置的len()函数。

count := len(m)
fmt.Println("Number of items in map:", count) // 输出map中的元素个数

len(m)返回m中当前存储的键值对数量。

2.3 查找和数据读取

可以根据键来查找和读取map中的数据。如果键不存在,则返回该类型的零值。

value, exists := m["apple"] // 查找键为"apple"的值,并检查键是否存在
if exists {fmt.Println("The value of 'apple' is:", value)
} else {fmt.Println("'apple' does not exist in the map.")
}

使用value, exists := m[key]的格式可以同时获取键对应的值和该键是否存在。如果键存在,existstrue,并且value为该键对应的值;如果键不存在,existsfalsevalue为该类型的零值。

2.4 删除数据

要从map中删除一个键值对,可以使用delete()函数。

delete(m, "banana") // 删除键为"banana"的键值对

delete(m, key)函数会从m中删除与key关联的键值对。如果key不存在,则delete什么也不做。

2.5 遍历数据

可以使用range关键字来遍历map中的所有键值对。

package mainimport "fmt"func main() {m := map[int]int{1: 11, 2: 12, 3: 13,}fmt.Printf("{ ")for key, value := range m {fmt.Printf("key: %d, value: %d  ", key, value)}fmt.Printf(" }\n")
}

range m会迭代m中的所有键值对,每次迭代都会返回当前的键和值。在上面的循环中,keyvalue分别被赋值为当前迭代的键和值,然后打印出来。
在这里插入图片描述

上面的输出结果非常理想,给我们的表象是迭代器按照map中的元素插入次序逐一遍历。那让我们再多遍历几次这个map

package mainimport "fmt"func doIteration(m map[int]int) {fmt.Printf("{ ")for key, value := range m {fmt.Printf("key: %d, value: %d  ", key, value)}fmt.Printf(" }\n")
}func main() {m := map[int]int{1: 11,2: 12,3: 13,}for i := 0; i < 3; i++ {doIteration(m)}
}

在这里插入图片描述

我们看见对同一map进行多次遍历,遍历的元素次序并不相同。这是因为Go运行时在初始化map迭代器时对起始位置做了随机处理。因此千万不要依赖遍历map所得到的元素次序


三、map的内部实现

在这里插入图片描述
和切片相比,map类型的内部实现要复杂得多。Go运行时使用一张哈希表来实现抽象的map类型,运行时实现了map操作的所有功能,包括查找、插入、删除、遍历等。本文这里只做一些简单的介绍。

3.1 初始状态

在Go语言中,当一个map被初始化时,它会分配一个较小的内存空间来存储键值对数据。这个初始的内存空间包含一定数量的桶(buckets),每个桶能够存储一个或多个键值对。初始状态下,这些桶都是空的。

map的初始化可以通过字面量、make函数或者直接使用map类型进行。例如:

// 使用字面量初始化
m1 := map[string]int{"apple": 5, "banana": 10}// 使用make函数初始化
m2 := make(map[string]int)// 直接声明map类型变量(需要后续进行初始化)
var m3 map[string]int
m3 = make(map[string]int)

在初始化时,map会预留一定的空间以准备存储键值对,但这个初始空间相对较小。

3.2 map扩容

map中的元素数量增加,负载因子(已存储的键值对数量与桶的数量的比例)也会随之增加。当负载因子超过某个预定的阈值时,map会进行扩容以保证性能。

扩容过程中,map会创建一个更大的桶数组,并且重新计算所有现有键值对的哈希值,将它们重新分布到新的桶数组中。这个重新哈希和分布的过程是为了确保键值对能够更均匀地分散在新的桶中,从而减少哈希冲突并提高查找效率。

扩容是一个相对昂贵的操作,因为它涉及到内存分配和大量数据的迁移。因此,在实际使用中,如果可能的话,最好提前预估map的大小并一次性分配足够的空间。

3.3 map并发

Go语言的map类型并不是并发安全的。这意味着如果多个goroutine同时对一个map进行读写操作,就可能导致数据竞争(data race)和不可预知的行为。

为了在并发环境中安全地使用map,有几种常见的解决方案:

  1. 使用互斥锁(Mutex):通过使用sync.Mutexsync.RWMutex来同步对map的访问。在每次读写map之前,先获取锁,操作完成后再释放锁。

  2. 使用sync.Map:Go语言标准库提供了一个并发安全的map实现,即sync.Map。它内部使用了分段锁和其他优化技术来提供高效的并发访问。

  3. 通道(Channel):另一种方法是使用Go的通道来序列化对map的访问。通过将所有对map的操作都通过一个或多个通道来进行,可以确保在同一时间只有一个goroutine能够访问map

在实际应用中,选择哪种并发控制方法取决于具体的使用场景和性能要求。对于简单的用例,使用互斥锁可能就足够了;而在需要高并发性能的场景中,sync.Map可能更为合适。


四、尽量使用cap参数创建map

在这里插入图片描述
由于扩容是一个相对昂贵的操作,因为它涉及到内存分配和大量数据的迁移,因此,如果可以的话我们最好对map使用规模做出粗略的估算,并使用cap参数对map实例进行初始化。

当你创建一个 map 而不指定容量时,Go 会自动为你分配一个初始的、未指定的容量。这个容量足以满足初始需求,并且随着 map 中元素的增加,Go 的运行时会自动管理其内部结构的大小调整,以容纳更多的元素。这是最常见也是最简单的初始化方式。

m := make(map[string]int)

如果你在创建 map 时明确指定了 cap 参数,你是在给 Go 提供一个关于你期望 map 最终可能包含多少个键值对的提示。这有助于减少 map 在增长过程中需要重新分配内存的次数,从而提高效率,尤其是在你知道 map 大致会有多大时。但请注意,指定的 cap 是一个提示而不是严格的限制,map 的实际容量可能会略高于指定的值,且 map 仍然可以在达到这个预设容量后继续增长。

m := make(map[string]int, 100)

优缺点分析:

  • 不使用 cap:简化初始化过程,让Go自动管理容量,适用于大多数情况,特别是当你不确定map最终大小时。
  • 使用 cap:通过预先估计map的大小,可以略微优化性能,减少动态扩容的次数,适合于明确知道或能估算map容量的场景。

选择是否使用 cap 主要取决于你对map最终规模的了解程度和对性能的特定需求。在不需要精确控制初始容量的情况下,省略 cap 是一个简洁且有效的方法。然而,如果你正处理大量数据且关心性能优化,明智地设定初始容量可以带来益处。

下面对两种初始化方式的性能进行对比:

package mainimport "testing"const mapSize = 10000func BenchmarkMapInitWithoutCap(b *testing.B) {for i := 0; i < b.N; i++ {m := make(map[int]int)for i := 0; i < mapSize; i++ {m[i] = i}}
}
func BenchmarkMapInitWithCap(b *testing.B) {for i := 0; i < b.N; i++ {m := make(map[int]int, mapSize)for i := 0; i < mapSize; i++ {m[i] = i}}
}

BenchmarkMapInitWithoutCap函数执行以下操作:

  1. 它使用一个循环,该循环将运行b.N次,其中b.Ntesting.B提供的,表示基准测试应该运行的次数。这是为了确保我们获得足够的数据点来平均性能测试结果,从而获得更准确的数据。

  2. 在每次循环中,它创建一个新的map,没有指定初始容量(make(map[int]int))。

  3. 然后,它向这个map中插入mapSize(即10000)个键值对,其中键和值都是循环变量i

这个基准测试的目的是测量在不指定初始容量的情况下,初始化并填充一个map的性能。

执行结果如下:
在这里插入图片描述

BenchmarkMapInitWithCap函数与BenchmarkMapInitWithoutCap非常相似,但有一个关键区别:

  1. 在创建map时,它使用make(map[int]int, mapSize)来指定一个初始容量提示,这个容量提示等于将要插入的键值对的数量(即10000)。

这个基准测试的目的是测量在指定了与将要插入的键值对数量相等的初始容量提示的情况下,初始化并填充一个map的性能。

下面是执行结果:
在这里插入图片描述
可以看出,使用cap参数的map实例的平均写性能是不使用cap参数的2倍。


五、总结

本文通过详细阐述了Go语言中 map 的基本概念、特性及其作为引用类型的行为,介绍了 map 的基本操作如插入、获取数据个数、查找、删除和遍历数据等。同时,深入剖析了 map 的内部实现,包括其初始状态、扩容机制以及并发问题。最后,本文强调了在使用 map 时,为了提高性能和减少内存重新分配的次数,应尽量在创建时提供合理的容量提示参数。通过全面理解 map 的工作原理和最佳实践,开发者可以更加有效地利用这一强大的数据结构来优化程序性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/346530.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【必会面试题】自旋中的ABA问题

目录 ABA问题描述ABA问题的影响解决ABA问题的方案 \qquad 自旋锁&#xff08;spinlock&#xff09;是一种用于实现互斥同步的锁机制&#xff0c;其基本思想是让线程在等待获取锁的过程中不断地检查锁是否可用&#xff0c;而不是进入睡眠状态。自旋锁适用于锁被持有的时间较短&a…

TF-2.10 实现用 BERT 从文本中抽取答案

前言 本文详细介绍了用 tensorflow-gpu 2.10 版本实现一个简单的从文本中抽取答案的过程。 数据准备 这里主要用于准备训练和评估 SQuAD&#xff08;Standford Question Answering Dataset&#xff09;数据集的 Bert 模型所需的数据和工具。 首先&#xff0c;通过导入相关库…

jetson nano 系统克隆及烧录

一、背景 二、系统克隆 1、硬盘挂载 查看块设备&#xff0c;执行命令lsblk&#xff0c;结果如下 其中&#xff0c;nvme0n1是我们要挂载的设备。 2、将块设备nvme0n1分成1个分区&#xff0c;执行命令sudo fdisk /dev/nvme0n1&#xff0c;出现分区界 面如下 输入m可以查看分区…

记录vue一个echarts页面 柱状图加平均分横线 双柱状图 横向双柱状图

<template><div class"app-container"><el-form :model"queryParams" ref"queryForm" size"small" v-show"showSearch" label-width"85px"><el-form-item label"园所名称" prop&q…

windows11 将此电脑放在桌面上

桌面--右键--个性化 然后右侧&#xff0c;找到主题: 然后桌面图标设置&#xff1a; 然后勾选计算机: 最后&#xff0c;点击【确定】按钮&#xff0c;桌面上就会有此电脑的图标了。

AI大模型-机器学习中的集成学习

机器学习中的集成学习 集成学习概述及主要研究领域 1.1 集成学习概述&#x1f4a5; “众人拾柴火焰高”、“三个臭皮匠顶个诸葛亮”等词语都在表明着群体智慧的力量&#xff0c;所谓的“群体智慧”指的就是一群对某个主题具有平均知识的人集中在一起可以对某一些问题提供出更…

UE 像素流与 Web 协同开发

UE 像素流与 Web 协同开发 创建Web端应用Web向UE发送消息emitCommandemitConsoleCommandemitUIInteraction UE接收Web的消息UE向Web发送消息Web接收UE的消息UE 冻结帧 与Web交互主要涉及两个方面&#xff0c;一个是UE向Web发送消息&#xff0c;另一个就是Web端向UE程序发送消息…

5分钟在阿里云上部署了超级玛丽小游戏,是一种什么样的体验?

大家好&#xff0c;我是java1234_小锋老师&#xff0c;作为程序设计开发人员&#xff0c;云部署项目是最基本的技能。所以锋哥分享下如何在阿里云上部署项目&#xff0c;我们以部署超级玛丽网页小游戏为例&#xff0c;教大家熟悉Linux云服务器&#xff0c;熟悉宝塔应用&#xf…

影视制作的未来:云渲染+虚拟制作+AI生成技术

在计算机技术和人工智能技术飞速发展的2024年&#xff0c;影视制作正在经历一场前所未有的变革。云渲染、虚拟制作和AI生成等新影视制作技术的结合&#xff0c;正在重新定义数字内容的创作流程&#xff0c;为影视产业带来了全新的可能性和机遇。这些前沿技术不仅提高了制作效率…

Elasticsearch 为时间序列数据带来存储优势

作者&#xff1a;来自 Elastic Martijn Van Groningen, Kostas Krikellas 背景 Elasticsearch 最近投资了对存储和查询时间序列数据的更好支持。存储效率一直是关注的主要领域&#xff0c;许多项目取得了巨大的成功&#xff0c;与将数据保存在标准索引中相比&#xff0c;可以节…

电子设计新纪元:三品PLM系统在快速变革中的适应性

随着科技的飞速发展&#xff0c;电子行业正经历着前所未有的变革。产品生命周期的缩短、技术迭代的加速以及市场竞争的加剧&#xff0c;都对电子行业提出了更高的管理要求。在这样的背景下&#xff0c;传统的产品数据管理PDM和产品生命周期管理PLM系统显得力不从心。本文将探讨…

H.264官方文档下载

H.264是ITU&#xff08;International Telecommunication Union&#xff0c;国际通信联盟&#xff09;和MPEG&#xff08;Motion Picture Experts Group&#xff0c;运动图像专家组&#xff09;联合制定的视频编码标准。其官方文档可以在ITU官网上下载&#xff1a;https://www.…

使用 OPENAI API 微调 GPT-3 的 Ada 模型

前言 本文主要是介绍了使用 openai 提供的 api 来完成对开放出来的模型进行微调操作。开放的模型有 curie 、babbage、ada 等&#xff0c;我这里以微调 ada 举例&#xff0c;其他类似。 需要提前安装好 openai 所需要的各种库&#xff0c;我这里的库版本是 openai-0.25.0 。以…

【已解决】chrome视频无法自动播放的问题

问题&#xff1a; 在用datav开发大屏的时候&#xff0c;放了一个视频组件&#xff0c;但是发现视频组件即使设置了自动播放&#xff0c;仍然无法自动播放 原因&#xff1a; 76 以上版本的谷歌浏览器只能在系统静音下自动播放 解决&#xff1a; 音频自动播放浏览器白名单设置&…

计算机网络期末考试知识点(关键词:江中)

目录 大家端午节快乐呀&#xff01;又到了一年两度的期末考试月了&#xff0c;这里给大家整理了一些复习知识点&#xff0c;大家可以边吃粽子边复习&#xff0c;事半功倍哈哈哈。祝各位期末过&#xff01;过&#xff01;过&#xff01;。 1 第一章 计算机网络体系结构 计算机…

WT32-ETH01作为TCP Server进行通讯

目录 模块简介WT32-ETH01作为TCP Server设置W5500作为TCP Client设置连接并进行通讯总结 模块简介 WT32-ETH01网关主要功能特点: 采用双核Xtensa⑧32-bit LX6 MCU.集成SPI flash 32Mbit\ SRAM 520KB 支持TCP Server. TCP Client, UDP Server. UDP Client工作模式 支持串口、wi…

安全生产新篇章:可燃气体报警器检验周期的国家标准解读

随着工业化进程的加快&#xff0c;安全生产成为了重中之重。 可燃气体报警器作为预防火灾和爆炸事故的重要设备&#xff0c;其准确性和可靠性直接关系到企业的生产安全和员工的生命财产安全。 因此&#xff0c;国家对可燃气体报警器的检验周期有着明确的规定&#xff0c;以确…

【Java面试】十二、Kafka相关

文章目录 1、Kafka如何保证消息不丢失1.1 生产者发消息到Brocker丢失&#xff1a;设置异步发送1.2 消息在Broker存储时丢失&#xff1a;发送确认机制1.3 消费者从Brocker接收消息丢失1.4 同步 异步组合提交偏移量 2、Kafka如何保证消费的顺序性3、Kafka高可用机制3.1 集群模式…

小程序自定义marker弹出框教程

需求背景 微信小程序开发&#xff0c;需要使用腾讯地图显示自定义marker&#xff0c;并且点击marker后弹出自定义的customCallout&#xff0c;并且customCallout的内容为用户点击marker的时候再从后台接口获取数据。 百度了一圈后发现居然没有一篇文章可以一次性完成&#xf…

Polar Web【简单】upload

Polar Web【简单】upload Contents Polar Web【简单】upload思路EXPPythonGo 运行&总结 思路 如题目所说&#xff0c;本题考查的是文件上传漏洞的渗透技巧。 打开环境&#xff0c;发现需要上传的是图片文件&#xff0c;故考虑使用截取数据包进行数据修改进行重放。在重发器…