巡检一般做哪些工作?
首先就是机房机柜环境检查,是否浸水漏水,是否有火灾隐患,老鼠蟑螂等,机房温湿度是否在正常值,七氟丙烷气压是否在正常范围(指针在绿色区域),然后就是设备外观上的检查,观察设备指示灯状态,主要关注是否有红色指示灯,橙色指示灯,散热风扇声音是否异常等直观性的检查。
第二就是登录设备,运行巡检命令,对设备进行巡检,查看设备运行是否有异常。由于我校的网络设备主要以华三、锐捷为主,下面附上整理的华三、锐捷等设备的常用巡检命令,方便大家查阅。因设备型号、版本差异,可能部分命令无法执行,可以通过tab键补全查看支持的命令。
运行巡检命令后,还需要查看设备是否异常,有些因业务使用变化较大的参数,还需要多次运行巡检命令,巡检的数据才相对准确,比如CPU、内存利用率,接口占用率,因隔几秒钟运行一次,并运行多次,从而获取比较准确的巡检数据,下面大概说一下常用的正常异常数值:
设备温度超过45℃需要注意
机房温度超过30℃需注意
机房正常湿度范围30%-55%
CPU利用率超过60%要引起注意
内存利用率超过80%要引起主机
接口流量是否接近接口带宽
接口不应有大量增加的CRC、dropped报文
华三
screen-length disable 取消分页
display version 查看版本
display clock 查看日期时钟
display fan 查看风扇状态
display power 查看电源信息
display cpu-usage 查看CPU利用率
display memory 查看内存利用率
display environment 查看温度信息
display device 查看设备信息
display device manuinfo 查看SN
display transceiver interface 查看光模块信息
display arp all 查看arp信息
display ip interface brief 查看三层接口的IP配置
display interface brief 查看接口运行状态
display ip routing-table 查看路由信息
display ospf peer 查看OSPF邻居信息
display bgp peer ipv4 查看bgp对等体
display current-configuration 查看当前生效配置
display saved-configuration 查看保存的配置
display lldp neighbor-information list 查看邻居
display link-aggregation summary 查看链路聚合组摘要
display ntp-service status 查看NTP服务的状态
display logbuffer 查看日志
锐捷
terminal length 0 取消分页
show version 查看版本
show running-config 查看当前配置
show logging 查看日志
show device 查看设备硬件模块
show interface 接口性能检查
show interface status 查看接口信息
show ip interface brief 查看接口IP信息
show interface transceiver 查看光模块信息
show environment 查看硬件运行状态
show power 查看电源
show fan 查看风扇
show temperature 查看温度
show clock 查看时钟
show cpu 查看CPU利用率
show memory 查看内存利用率
show vlan 查看vlan
show arp 查看arp
show mac address-table
show mac-address-table 查看mac地址表
show ip route 查看路由
show license 查看license
show lldp 查看邻居信息