技术文章
GDB定位Percona MySQL5.7特定版本死锁hang死的故障分析#92108
对于环境中出现死锁的Percona MySQL 5.7.23-23半同步主从,数据库节点上部署启动exporter后,发现数据库的连接状态异常,对业务产生了一定影响,对导致问题的根本原因进行分析。
对于环境中出现死锁的Percona MySQL 5.7.23-23半同步主从,数据库节点上部署启动exporter后,发现数据库的连接状态异常,对业务产生了一定影响,对导致问题的根本原因进行分析。
在限制了临时表空间后,当应用仍按以前的方式访问时,ibtmp1文件达到2G后,程序一直等待直到超时断开连接。 SHOW PROCESSLIST显示程序的连接线程为sleep状态,state和info信息为空。 本文对此现象进行原因分析及状态描述。
本文分析的缺陷是MySQL bug#89370,其主要的现象是:配置半同步(复制)到多个从库,部分从库在一段时间内无法复制数据,但所有复制状态均正常。
MGR作为MySQL原生的高可用方案,它的基于共识协议的同步和决策机制,看起来也更为先进。吸引了一票用户积极尝试,希望通过MGR架构解决RPO=0的高可用切换。在实际使用中经常会遇到因为网络抖动的问题造成集群故障,本文以实际客户案例进行详细分析。
存在多个半同步从库时,如果参数 rpl_semi_sync_master_wait_for_slave_count=1,启动第1个半同步从库时可以正常启动,启动第2个半同步从库后有很大概率 slave_io_thread 停滞,(复制状态正常,Slave_IO_Running: Yes,Slave_SQL_Running: Yes,但是完全不同步主库 binlog )