作者:刘安

爱可生测试团队成员,主要负责 TXLE 开源项目相关测试任务,擅长 Python 自动化测试开发,最近醉心于 Linux 性能分析优化的相关知识。

本文来源:原创投稿

*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。

最近在极客时间上学习《Linux 性能优化实战》,接触到了基于 eBPF 的 BCC 软件包。今天来分享一下 bcc 软件包中用来观测 MySQL 的几个工具。

1. 什么是 BPF 和 eBPF

  • BPF = Berkeley Packet Filter

    https://en.wikipedia.org/wiki/BerkeleyPacketFilter

  • BPF 是类 Unix 系统上数据链路层的一种原始接口,提供原始链路层封包的收发

  • BPF 支持过滤数据包——用户态的进程可以提供一个过滤程序来声明它想收到哪些数据包

  • 从 3.18 版本开始,Linux 内核提供了一种扩展的 BPF 虚拟机,被称为“extended BPF“,简称为 eBPF。它能够被用于非网络相关的功能,比如附在不同的 tracepoints 上,从而获取当前内核运行的许多信息

实际上 tcpdump 使用的 libpcap 就是基于 BPF 的。而接下来我们要介绍的基于 eBPF 的 bcc 软件包可以简单的理解为过滤内核运行信息的 “tcpdump”。

以下是一张 BPF 的工作流程图:

2. 什么是 bcc

  • Bcc 的开源项目:https://github.com/iovisor/bcc

  • eBPF 虚拟机使用的是类似于汇编语言的指令,对于程序编写来说直接使用难度非常大。bcc 提供了一个名为 bcc 的 python 库,简化了 eBPF 应用的开发过程

  • Bcc 收集了大量现成的 eBPF 程序可以直接拿来使用,可以通过以下工具分布图感受一下

3. 安装 bcc

  1. # Ubuntu

  2. sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 4052245BD4284CDD

  3. echo "deb https://repo.iovisor.org/apt/$(lsb_release -cs) $(lsb_release -cs) main" | sudo tee /etc/apt/sources.list.d/iovisor.list

  4. sudo apt-get update

  5. sudo apt-get install bcc-tools libbcc-examples linux-headers-$(uname -r)

  6. export PATH=$PATH:/usr/share/bcc/tools


  7. # CentOS

  8. yum install bcc-tools

  9. export PATH=$PATH:/usr/share/bcc/tools

以 CentOS 7.7 的系统为例,安装后的工具集如下:
  1. [root@liuan tools]# ls

  2. argdist btrfsslower dbslower ext4dist gethostlatency killsnoop nfsslower perlflow pythonflow rubystat solisten tclobjnew tcpstates vfsstat

  3. bashreadline cachestat dbstat ext4slower hardirqs lib nodegc perlstat pythongc runqlat sslsniff tclstat tcpsubnet wakeuptime

  4. biolatency cachetop dcsnoop filelife javacalls llcstat nodestat phpcalls pythonstat runqlen stackcount tcpaccept tcptop xfsdist

  5. biosnoop capable dcstat fileslower javaflow mdflush offcputime phpflow reset-trace runqslower statsnoop tcpconnect tcptracer xfsslower

  6. biotop cobjnew deadlock_detector filetop javagc memleak offwaketime phpstat rubycalls shmsnoop syncsnoop tcpconnlat tplist

  7. bitesize cpudist deadlock_detector.c funccount javaobjnew mountsnoop oomkill pidpersec rubyflow slabratetop syscount tcpdrop trace

  8. bpflist cpuunclaimed doc funclatency javastat mysqld_qslower opensnoop profile rubygc sofdsnoop tclcalls tcplife ttysnoop

  9. btrfsdist criticalstat execsnoop funcslower javathreads nfsdist perlcalls pythoncalls rubyobjnew softirqs tclflow tcpretrans vfscount

4. 使用 bcc 工具观测 MySQL:

1)dbstat
功能:将 MySQL/PostgreSQL 的查询延迟汇总为直方图

语法:

  1. dbstat [-h] [-v] [-p [PID [PID ...]]] [-m THRESHOLD] [-u] [-i INTERVAL]

  2. {mysql,postgres}

选项:

  1. {mysql,postgres} # 观测哪种数据库

  2. -h, --help # 显示帮助然后退出

  3. -v, --verbose # 显示BPF程序

  4. -p [PID [PID ...]], --pid [PID [PID ...]] # 要观测的进程号,空格分隔

  5. -m THRESHOLD, --threshold THRESHOLD # 只统计查询延迟比此阈值高的

  6. -u, --microseconds # 以微秒为时间单位来显示延迟(默认单位:毫秒)

  7. -i INTERVAL, --interval INTERVAL # 打印摘要的时间间隔(单位:秒)

示例:

  1. # 使用 sysbench 在被观测数据库上执行 select

  2. [root@liuan tools]# dbstat mysql -p `pidof mysqld` -u

  3. Tracing database queries for pids 3350 slower than 0 ms...

  4. ^C[14:42:26]

  5. query latency (us) : count distribution

  6. 0 -> 1 : 0 | |

  7. 2 -> 3 : 0 | |

  8. 4 -> 7 : 0 | |

  9. 8 -> 15 : 0 | |

  10. 16 -> 31 : 0 | |

  11. 32 -> 63 : 0 | |

  12. 64 -> 127 : 0 | |

  13. 128 -> 255 : 0 | |

  14. 256 -> 511 : 0 | |

  15. 512 -> 1023 : 491612 |****************************************|

  16. 1024 -> 2047 : 46152 |**** |

  17. 2048 -> 4095 : 261 | |

  18. 4096 -> 8191 : 1 | |

  19. 8192 -> 16383 : 3 | |

2)dbslower

功能:跟踪 MySQL/PostgreSQL 的查询时间高于阈值

语法:

  1. dbslower [-h] [-v] [-p [PID [PID ...]]] [-x PATH] [-m THRESHOLD]

  2. {mysql,postgres}

参数:

  1. {mysql,postgres} # 观测哪种数据库

  2. -h, --help # 显示帮助然后退出

  3. -v, --verbose # 显示BPF程序

  4. -p [PID [PID ...]], --pid [PID [PID ...]] # 要观测的进程号,空格分隔

  5. -m THRESHOLD, --threshold THRESHOLD # 只统计查询延迟比此阈值高的

  6. -x PATH, --exe PATH # 数据库二进制文件的位置

示例:

  1. # 使用sysbench在被观测数据库上执行update_index

  2. [root@liuan tools]# dbslower mysql -p `pidof mysqld` -m 2

  3. Tracing database queries for pids 3350 slower than 2 ms...

  4. TIME(s) PID MS QUERY

  5. 1.765087 3350 2.996 UPDATE sbtest1 SET k=k+1 WHERE id=963

  6. 3.187147 3350 2.069 UPDATE sbtest1 SET k=k+1 WHERE id=628

  7. 5.945987 3350 2.171 UPDATE sbtest1 SET k=k+1 WHERE id=325

  8. 7.771761 3350 3.853 UPDATE sbtest1 SET k=k+1 WHERE id=595

5. 使用限制

  • bcc 基于 eBPF 开发(需要 Linux 3.15 及更高版本)。bcc 使用的大部分内容都需要 Linux 4.1 及更高版本。

  • “bcc.usdt.USDTException: failed to enable probe ‘query__start’; a possible cause can be that the probe requires a pid to enable” 需要 MySQL 具备 Dtrace tracepoint。

    dbslower man page:https://github.com/iovisor/bcc/blob/master/man/man8/mysqld_qslower.8#L17-L18