主机内存 64G,实际才使用了 22G 多,怎么会发现生 OOM,free used 使用了 61G,那么我的内存去哪了?
4、查看 /proc/meminfo
看上面发现和我们用 free 和 top 看到的值是一样的
继续看,
在传统大页这里发现了问题,
在这里,传统大页 Total 配置了 20000,FREE 也为 20000,说明配置了大页但没在使用,hugepagesize 为 2M,这一块预留的就是 40G 大页内存。
Tips:“大内存页”也称传统大页、大页内存等有助于 Linux 进行虚拟内存的管理,标准的内存页为 4KB,这里使用“大内存页”最大可以定义 1GB 的页面大小,在系统启动期间可以使用“大内存页”为应用程序预留一部分内存,这部分内存被占用且永远不会被交换出内存,它会一直保留在那里,直到改变配置。(详细介绍请看下面链接官方解释)
5、那么这 40G 大页内存是分配给谁的呢?
查询一下:
shell> /proc/sys/vm/hugetlb_shm_group27shell> id 27uid=27(mysql) gid=27(mysql) groups=27(mysql)
hugetlb_shm_group 文件里填的是指定大页内存使用的用户组 id,这里查看到是 MySQL 组 id,那既然是给 MySQL 的为什么 free 等于 total,并且 mysql 还只有 20 多 G 实际使用内存呢?
原来在 MySQL 中还有专门启用大内存页的参数,在 MySQL 大内存页称为 large page。
6、查看 MySQL 配置文件
发现配置文件中确实有 large-page 配置,但出于禁用状态。
后与业务确认,很早之前确实启用过 mysql 的 large page,不过后面禁用了。排查到这基本就有了结论。
四、结论
这套环境之前开启了 20000 的大内存页,每页大小为 2MB,占用了 40G 内存空间,给 MySQL 使用,并且 MySQL 开启了 large page,但后来不使用的时候,只关闭了 MySQL 端的 large page 参数,但没有实际更改主机的关于大内存页的配置,所以导致,实际上主机上的还存在 20000 的大内存页,并且没在使用,这一部分长期空闲,并且其他程序不能使用。