作者:Agustín

翻译:孟维克 原文:https://www.percona.com/blog/2019/11/20/profiling-software-using-perf-and-flame-graphs/

在这篇博文中,我们将探讨如何一起使用 perf 和火焰图。它们用于生成我们选择的软件正在调用的函数的图形。在此我们使用 Percona 分支版本,但是它可以扩展到任何可以进行解析堆栈跟踪的软件。
在继续之前,请注意,与任何分析工具一样,除非您知道自己在做什么,否则不要在生产环境运行。
安装需要的软件包
为了简单,为使用 CentOS7 版本,但是对于基于 Debian 的发行版来说,它们应该是相同的(步骤中的唯一区别是用 apt-get install linux-tools-$(uname -r) 代替 yum 命令)。
安装 perf
  1. SHELL> sudo yum install -y perf

获得火焰图软件包
  1. SHELL> mkdir -p ~/src

  2. SHELL> cd ~/src

  3. SHELL> git clone https://github.com/brendangregg/FlameGraph

全部安装完毕!让我们继续
抓取采集样本
火焰图是一种可视化数据的方式,所以我们需要一些可以作为基础的样本。可以用三种方式做到这一点(请注意,这里我们使用 -p 选项仅抓取我们感兴趣的进程的数据,但是如果需要,我们可以抓取所有正在运行的进程的数据)
1. 仅抓取设定时间(这里是10秒)
  1. SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld) --sleep 10

2. 抓取直到我们发出中断讯号(CTRL+C)
  1. SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld)

3. 抓取整个进程的生命周期
  1. # 注意,如果我们中断了这个variant,我们同样杀死了上面的子进程

  2. SHELL> sudo perf record -a -F 99 -g --/sbin/mysqld \

  3. --defaults-file=/etc/percona-server.conf.d/mysqld.cnf --user=mysql

或者
  1. SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld) --mysql -e "SELECT * FROM db.table"

在第三个场景的第一种情况下,我们被迫抓取了所有进程的数据,因为实现不可能直到进程 ID 号(PID)(通过执行该命令,我们实际上正在启动 MySQL 服务)。当您希望从进程启动时就开始获取数据,这种类型的命令非常有用,否则是不可能的。
在第二个场景下,我们在正在运行的 MySQL 服务上执行一个查询,因此我们可以使用 -p 选项抓取这个进程的数据。例如,如果您希望抓取作业正在运行的时的数据,这就非常方便。
准备样本
初始化抓取完成后,我们需要将收集到的数据“可读”。这是必要的,因为通过 perf record 生成的是二进制格式。因此,我们将执行:
  1. SHELL> sudo perf script > perf.script

默认情况下它读取 perf.dataperf record 也默认输出到这个文件。它可以分别使用 -i 选项和 -o 选项来覆盖写入。
现在我们能读取生成的文本文件,因为已经是易读的形式。然而,当您做到这时,你很快就会意识到我们为什么要将这些数据聚合为更易懂的形式。
生成火焰图
我们可以将第一个命令的输出作为第二个命令的输出,在一行命令中完成以下工作。因为我们没有将火焰图的 git 文件夹加入到 PATH 变量中,因此要使用完整路径。
  1. SHELL> ~/src/FlameGraph/stackcollapse-perf.pl perf.script | ~/src/FlameGraph/flamegraph.pl > flamegraph.svg

现在我们在任何浏览器打开 .svg 文件并开始分析富含信息的图形。
看起来如何
作为示例,我将使用第 2 种抓取数据的方法的完整命令、输出和生成火焰图的屏幕截图帖在如下。我们执行 INSERT INTO...SELECT 语句,我们可以分析执行过程。
看起来如何
作为示例,我将使用第 2 种抓取数据的方法的完整命令、输出和生成火焰图的屏幕截图帖在如下。我们执行 INSERT INTO...SELECT 语句,我们可以分析执行过程。
  1. SHELL> time sudo perf record -a -F 99 -g \

  2. -p $(pgrep -x mysqld) \

  3. --mysql test -e "INSERT INTO joinit SELECT NULL, uuid(), time(now()), (FLOOR( 1 + RAND( ) *60 )) FROM joinit;"

  4. Warning:

  5. PID/TID switch overriding SYSTEM

  6. [ perf record: Woken up 7 times to write data ]

  7. [ perf record: Captured and wrote 1.909 MB perf.data (8214 samples) ]


  8. real 1m24.366s

  9. user 0m0.133s

  10. sys 0m0.378s

  1. SHELL> sudo perf script | \

  2. ~/src/FlameGraph/stackcollapse-perf.pl perf.script | \

  3. ~/src/FlameGraph/flamegraph.pl > mysql_select_into_flamegraph.svg

敏锐的读者会注意到,我们在这里更进一步,通过一个管道(|)合并了步骤 2 和步骤 3,避免向 perf.script 文件写入和读取数据。此外,还有时间输出,我们可以对工具生成的数据量进行估计(1 分 25 秒生成约 2Mb 数据);当然这取决于许多因素,所以要谨慎对待,并在自己的环境中进行测试。

生成的火焰图如下:

优化的一个明显的候选对象是 write_record如果我们使这个函数变的更快,那么就有很大潜力来减少整体执行时间(左下角的蓝色方框表示,我们可以看到 60% 的样本是在这个代码路径中获取的)。在下面的最后一个章节中,我们将提供一篇博客,该文章详细解释了如何解释火焰图,但是现在,您只需要知道移动鼠标在各个函数名上,它将动态地更改左下角显示的信息。您也可以通过以下指南更好理解它:

总结
对于支持工程师,在许多情况下,我们使用此工具来深入了解 MySQL 正在执行的内容及执行的时间。这样,我们就可以更好地了解特定负载背后的操作,并采取相应的措施。这个软件用于优化或故障排查,它是我们工具箱中非常强大的工具!众所周知,人类处理图像比处理文本更擅长,而在我看来,该工具十分出色。
相关链接

Interpreting Flame Graphs (scroll down to the “Flame Graph Interpretation” section)

https://queue.acm.org/detail.cfm?id=2927301


Flame Graphs 201, Percona分享会

https://www.percona.com/resources/webinars/flame-graphs-201


Brendan Gregg ,火焰图作者

http://www.brendangregg.com/flamegraphs.html

社区近期动态

No.1

Mycat 问题免费诊断

诊断范围支持:

Mycat 的故障诊断、源码分析、性能优化

服务支持渠道:

技术交流群,进群后可提问

QQ群(669663113)

社区通道,邮件&电话

osc@actionsky.com

现场拜访,线下实地,1天免费拜访

关注“爱可生开源社区”公众号,回复关键字“Mycat”,获取活动详情。

No.2

社区技术内容征稿

征稿内容:

格式:.md/.doc/.txt

主题:MySQL、分布式中间件DBLE、数据传输组件DTLE相关技术内容

要求:原创且未发布过

奖励:作者署名;200元京东E卡+社区周边

投稿方式:

邮箱:osc@actionsky.com

格式:[投稿]姓名+文章标题

以附件形式发送,正文需注明姓名、手机号、微信号,以便小编及时联系