大家好,我是煎鱼。
最近又有同学问我这个日经话题,想转他文章时,结果发现我的公众号竟然没有发过,因此今天我再唠叨两句,好让大家避开这个 “坑”。
有的小伙伴没留意过 Go map 输出、遍历顺序,以为它是稳定的有序的,会在业务程序中直接依赖这个结果集顺序,结果栽了个大跟头,吃了线上 BUG。
有的小伙伴知道是无序的,但却不知道为什么,有的却理解错误?
今天通过本文,我们将揭开 for range map
输出的 “神秘” 面纱,看看它内部实现到底是怎么样的,顺序到底是怎么样?
开始吸鱼之路。
前言
例子如下:
1 | go复制代码func main() { |
假设运行这段代码,输出的结果是怎么样?是有序,还是无序输出呢?
1 | yaml复制代码k: 3, v: EDDYCJY4 |
从输出结果上来讲,是非固定顺序输出的,也就是每次都不一样。但这是为什么呢?
首先建议你先自己想想原因。其次我在面试时听过一些说法。有人说因为是哈希的所以就是无(乱)序等等说法。当时我是有点 ???
这也是这篇文章出现的原因,希望大家可以一起研讨一下,理清这个问题 :)
看一下汇编
1 | scss复制代码 ... |
我们大致看一下整体过程,重点处理 Go map 循环迭代的是两个 runtime 方法,如下:
- runtime.mapiterinit
- runtime.mapiternext
但你可能会想,明明用的是 for range
进行循环迭代,怎么出现了这两个函数,怎么回事?
看一下转换后
1 | go复制代码var hiter map_iteration_struct |
实际上编译器对于 slice 和 map 的循环迭代有不同的实现方式,并不是 for
一扔就完事了,还做了一些附加动作进行处理。而上述代码就是 for range map
在编译器展开后的伪实现
看一下源码
runtime.mapiterinit
1 | go复制代码func mapiterinit(t *maptype, h *hmap, it *hiter) { |
通过对 mapiterinit
方法阅读,可得知其主要用途是在 map 进行遍历迭代时进行初始化动作。共有三个形参,用于读取当前哈希表的类型信息、当前哈希表的存储信息和当前遍历迭代的数据
为什么
咱们关注到源码中 fastrand
的部分,这个方法名,是不是迷之眼熟。没错,它是一个生成随机数的方法。再看看上下文:
1 | go复制代码... |
在这段代码中,它生成了随机数。用于决定从哪里开始循环迭代。更具体的话就是根据随机数,选择一个桶位置作为起始点进行遍历迭代
因此每次重新 for range map
,你见到的结果都是不一样的。那是因为它的起始位置根本就不固定!
runtime.mapiternext
1 | go复制代码func mapiternext(it *hiter) { |
在上小节中,咱们已经选定了起始桶的位置。接下来就是通过 mapiternext
进行具体的循环遍历动作。该方法主要涉及如下:
- 从已选定的桶中开始进行遍历,寻找桶中的下一个元素进行处理
- 如果桶已经遍历完,则对溢出桶
overflow buckets
进行遍历处理
通过对本方法的阅读,可得知其对 buckets 的遍历规则以及对于扩容的一些处理(这不是本文重点。因此没有具体展开)
总结
在本文开始,咱们先提出核心讨论点:“为什么 Go map 遍历输出是不固定顺序?”。
经过这一番分析,原因也很简单明了。就是 for range map
在开始处理循环逻辑的时候,就做了随机播种…
你想问为什么要这么做?
当然是官方有意为之,因为 Go 在早期(1.0)的时候,虽是稳定迭代的,但从结果来讲,其实是无法保证每个 Go 版本迭代遍历规则都是一样的。而这将会导致可移植性问题。
因此,改之。也请不要依赖…
若有任何疑问欢迎评论区反馈和交流,最好的关系是互相成就,各位的点赞就是煎鱼创作的最大动力,感谢支持。
文章持续更新,可以微信搜【脑子进煎鱼了】阅读,回复【000】有我准备的一线大厂面试算法题解和资料。
本文 GitHub github.com/eddycjy/blo… 已收录,欢迎 Star 催更。
参考
本文转载自: 掘金