1.分析及解决方案概述
分析原因
通过对现有信息的分析,可以看到arp广播异常是由于交换机缓存引起。
对于不同网段vlan间通信需要通过网关进行,但是网关的MAC地址表缓存的MAC-IP关系表默认300秒(交换机默认老化时间)甚至更长时间进行更新。
解决方案
针对现有情况,建议如下:
1)清理交换机MAC地址表缓存,确保MAC正确
2)在VIP所在主机进行一次ARP广播,确保网关知道最新的MAC(修改MHA脚本自动化实现)
后续计划 修改MHA脚本,加入arp相关命令行。

2.问题描述
03月7日MHA架构MySQL测试failover失败,未导致系统/业务发生重启/业务中断,未产生不良影响,后通过清理交换机MAC地址表缓存,确保MAC正确,不同vlan间通信恢复,需要从根本上分析问题原因,避免该类问题再次发生;
操作系统版本 RHEL 7
数据库架构 MHA
数据库版本 MySQL 8.0.45
业务名称 xxx

3.问题分析
3.1问题现象
MHA架构MySQL测试failover失败,无法和最新的VIP通信

没来得及记录,现象是同网段和这个VIP地址通信成功,不同网段和这个VIP地址通信失败

3.2MHA配置文件分析
未发现异常

3.3MAC地址分析
可以发现VIP漂移后,对应主机的MAC地址改变

立即清理交换机arp缓存,或者在VIP主机执行以下命令行

到交换机查看对应MAC-IP地址表,可以发现MAC地址和生存时间改变


3.4MHA脚本分析
可以发现定义了arp广播,但是没有调用

3.5问题分析总结
综合上述分析,我们可以看到:
arp广播异常是由于交换机缓存引起。
对于不同网段vlan间通信需要通过网关进行,但是网关的MAC地址表缓存的MAC-IP关系表默认300秒(交换机默认老化时间)甚至更长时间进行更新。

4.处理/优化建议
针对现有情况,建议如下:
1)清理交换机MAC地址表缓存,确保MAC正确
2)在VIP所在主机进行一次ARP广播,确保网关知道最新的MAC(修改MHA脚本自动化实现)

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐