如何编写内存高效及CPU调优的Go结构体

Coding Alan 4个月前 (07-26) 303次浏览 0个评论 扫描二维码

结构体是包含多个字段的集合类型,用于将数据组合为记录。这样可以将与同一实体相关联的数据利落地封装到一个轻量的类型定义中,然后通过对该结构体类型定义方法来实现不同的行为。

本文会尝试从内存利用CPU周期的角度讲解如何高效编写struct

Go语言结构体

我们来看下面这一结构体,这是我们一个奇怪用例所定义的terraform资源类型:

使用如下代码来了解TerraformResource结构体需要分配多少内存:

输出结果

因此结构体TerraformResource所需分配的总内存是88字节TerraformResource类型内存分配如下图所示:

TerraformResource的内存分配示意图

为什么是88字节呢?16 +16 + 1 + 16 + 1+ 16 + 4 = 70 bytes,多出来的18字节是从哪来的?

涉及到结构体的内存分配时,总是会分配连续、字节对齐的内存,字段按所定义的顺序进行内存分配和存储。这里的字节对齐表示连续的内存块按平台的字大小进行偏移排列。

字节对齐后的内存分配示意

可以很清楚地看到TerraformResource.HaveDSLTerraformResource.isVersionControlledTerraformResource.ModuleVersionMajor分别仅占用1字节1字节4字节。剩余的空间使用空白字节进行填充。

所以重新计算一下:

数据占用字节 = 16字节 + 16字节 + 1字节 + 16字节 + 1字节 + 16字节 + 4字节 = 70字节

空白字节 = 7字节 + 7字节 + 4字节 = 18字节

总字节数 = 数据占用字节 + 空白字节 = 70字节 + 18字节 = 88字节

那如何修复这个问题呢?通过恰当地的数据结构对齐,我们可以这样来定义结构体:

使用优化后的结构体来运行同一段代码:

输出结果

现在TerraformResource类型总的内存占用72字节。我们来看下在内存中是如何排列的:

结构体的内存排列

仅仅是通过对结构体元素进行了一轮数据结构对齐我们就将所占用的内存由88字节降到了72字节,真是太棒了!!!

我们再来算一下

数据占用字节 = 16字节 + 16字节 + 16字节 + 16字节 +4字节 + 1 byte + 1字节 = 70字节

空白字节 = 2字节

总字节数 = 数据占用字节 + 空白字节 = 70字节 + 2字节 = 72字节

通过恰当的数据结构对齐不仅优化了内存占用,还优化了CPU读取周期,怎么做到的呢?

CPU以为单位从内存中进行读取,一个在32位系统中占用4字节、64位系统中占用8字节。我们声明的第一个结构体类型TerraformResourceCPU需要读取11个字才能读完:

CPU读取优化前结构体

但对优化后的结构体只需要读取9个字:

CPU读取优化后结构体

通过恰当地对结构体进行数据结构排序我们可以让内存分配CPU 读取都变得高效。

这只是一个小例子,试想一个带有20或30个不同类型字段的大型结构体。有计划的数据结构对齐一定是有回报的 … 🤩

希望这篇文章可以让读者更加了解结构体的内部原理、内存分配和所需的CPU读取周期。但愿有所帮助!!

Happy Coding!!

原文来自:Satyajit Roy

喜欢 (0)
[]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址