记一次zerotier的故障。
TLDR: 强制重启主机,导致虚拟机磁盘出现错误。
AllInOne主机中装了一堆各种用途的虚拟机,从笔记本上访问这些需要依赖于一个openwrt虚拟机中的zerotier进行组网。 在一次主机重启后, 发现openwrt中的zerotier不能正常工作了。 排查发现zerotier的虚拟网卡没有分配到IP,手动加上IP后组网正常。 进一步排查zero-ui,发现之前的openwrt节点点一直处于离线状态, 倒是有一个新的节点接入了(一开始没注意到,这点对后续排查很重要)。 回到openwrt侧, 进一步发现每次openwrt重启,zerotier的nodeid都会随机生成一个(当前获取不到节点的配置参数)。 进一步排查发现openwrt的root fs变成只读了, e2fsck发现文件系统有错误,修复后重启系统,zerotier读到之前的nodeid了,一切回到正常。 想到最近在换主板,调试过程直接重启过主机, 总结一下route cause: 强制重启主机,导致虚拟机磁盘出现错误