网吧升级机房问题集

现象:机房升级改造中,更换上一台新采购的星能万兆服务器,增加一台TENET万兆中心交换机后,连续几天出现星能服务器网维虚拟盘忙时服务卡死,带的客户机虚拟盘全部卡住。

       排查:

  1. 前面一二次以为是在升级机房时撞到万兆线导致的,然后没太在意,因为一天只有一次这情况。
  2. 然后连续第二天同样的情况发生时,机房没有任何人,才检查了虚拟盘日志,发现发包失败,提示网络有内网流控限速,但是检查了新万兆交换机和老中心交换机都没有设置流控。按别一个区域的做法,对万兆网卡参数进行网维推荐的intel网卡优化方式进行设置。(但是优化后虚拟盘游戏同步速度只有2M,无盘镜像同步也只有几M。)
  3. 然后排查虚拟盘固态盘速度及健康度没有问题、出故障时测此固态盘速度也正常,排除硬盘问题。但由于此星能服务器采购回来就坏了一个集成化硬盘端口,所以还是决定第二天更换固态盘和硬盘接口。
  4. 同步更换了万兆网卡的驱动为网方驱动(不进行网卡参数优化),卸载虚拟盘软件,删除目录再全新安装软件。
  5. 第三天全部按以上方法调试后,结果还是出现同样的故障!!且只带一台客户机的虚拟盘也卡的要死!
  6. 再回过头想一遍,星能有二块万兆网卡,一块带无盘,一块带虚拟盘,在出现虚拟盘服务卡死的情况下,另一块网卡带的无盘一点问题都没有!马上将虚拟盘也设置由无盘带的那块网卡上,禁用以前虚拟盘的网卡。 再找客户机用那网卡带机测试,问题消失了!!晚上再带几十台机器,测试一天多都没有再出现问题。
  7. 故障原因再回测一次,万兆中心1号端口买回来时就损坏,出问题的网卡接在2号端口上,但是二条万兆线都经过了更换测试,问题应该确定在新万兆中心的2号端口上。

     总结:遇到这类问题,应该先从最简单的方向去想,去处理,而不要将问题想得太复杂化,因为前提已经发现交换机1号端口损坏,而星能二条万兆线就接在2、3端口上,下面故障时,星能服务器操作和测速都正常,应该将问题尽快集中在交换机和万兆线上来,从这方向去操作的话,可能一个小时就能处理好,更加不用花几个早上的时间去做复杂化排查!

相关内容推荐