none
Windows 2008 R2的NLB经常短时间网络中断

    问题

  • 两台Windows 2008 R2的服务器,建了单播模式的NLB,已经运行了三年以上。最近两周开始经常性发生短时间网络中断。有时一天几次,没有固定的时间点,一般三五分钟后就自行恢复。多数是一台中断,但也有几次两台一起中断。

    在这两台服务器上设置了ping的脚本观察,在中断的时候,它们向外ping是不通的,但ping自身IP是正常的。

    Windows的日志中没有相应的报错信息(除了网络中断时一些应用的报错,比如无法与DNS、LDAP、DC通信之类的)。

    尝试过更换网卡端口、更换网线、更换交换机,还把其他正常服务器的网线与这两台的交换,但都无改善,所以看上去似乎网络设备没什么关系。

    还找过服务器厂商从硬件层面诊断,也没有发现异常。

    现在完全没了思路,有什么好的诊断和解决办法吗?



    2016年8月19日 1:05

答案

全部回复

  • 您好:

    》》在这两台服务器上设置了ping的脚本观察,在中断的时候,它们向外ping是不通的,但ping自身IP是正常的。

    Windows的日志中没有相应的报错信息(除了网络中断时一些应用的报错,比如无法与DNS、LDAP、DC通信之类的)。

    你可以尝试在故障发生的时候做一个网络抓包,ping一下其他地址,检查一下数据传输断在哪一步。

    您可以通过以下地址下载Windows network monitor:

    https://www.microsoft.com/en-us/download/details.aspx?id=4865

    ________________________________________

    Best Regards,

    Cartman

    如果此回复对您有帮助,请标记为答案,谢谢。

    2016年8月19日 8:18
    版主
  • Hi Cartman,

    感谢你的回应。

    断网的时候ping网关也是不通的,所以应该不是路由方面的问题。

    麻烦的是比较难抓到断网时刻的包。因为故障发生时间不确定,发生后时间不长又自己恢复了,所以还来不及赶到机房,故障已经消失了。

    2016年8月22日 3:39
  • 您好:

    确实随机发生的故障是比较难处理,如果可以的话可以做一个24小时为周期的抓包,每天清理一次无用的日志文件,直到故障发生。

    ________________________________________

    Best Regards,

    Cartman

    如果此回复对您有帮助,请标记为答案,谢谢。

    2016年8月23日 5:34
    版主