2008年10月12日星期日

nfs的server端没有响应

突然接到alert:apache进程数过多!
查看server apache进程数过多,查看mysql的状态,正常。查看apache日志,正常,但是又有alter,该台server连不上内网中的一台nfs!
本能的df了一下,卡在某个nfs那里!
查看了nfs server,正常!
于是决定重新挂载nfs
这里需要注意的是,需要详细的写清楚nfs的路径ip:path ,而不能直接卸载映射到本地的目录!
卸载后再挂载,这时一切正常!
继续查看原因
在nfs server 的message中有网卡重启的信息

Oct 12 11:46:39 **** kernel: NETDEV WATCHDOG: eth1: transmit timed out
Oct 12 11:46:40 **** kernel: bnx2: eth1 NIC Link is Down
Oct 12 11:46:41 **** kernel: bnx2: eth1 NIC Link is Up, 100 Mbps full duplex
主机名用****代替

nfs client 的message中同样有相关信息

Oct 12 11:11:23 **** kernel: nfs: server *.*.*.* not responding, st
ill trying
Oct 12 11:11:56 **** last message repeated 13 times
Oct 12 11:12:01 **** last message repeated 2 times

问题:
1.相互出问题的时间并不一致
2.交换机并不存在问题,连接在同一交换机上的其他设备没有这样的日志.
结论:迷惑中:暂时只能先解决问题,初步认为网卡有些问题,需要再观察!

没有评论: