网络丢包排查指南:从物理层到应用层的全面故障诊断步骤
1、物理层物理电路接触不良
光模块故障
设备硬件故障
2.数据链路层
二层环路导致CPU占用率过高
畸形数据帧直接丢弃(源MAC地址为广播MAC等)
MAC地址漂移
MTU值不匹配
第 2 层攻击
3、网络层
负载分担路径局部故障
消息碎片丢失且无法重组
三层攻击
生存时间为0
防火墙往返路径不一致
4、传输层
MSS 不匹配
5、应用层
端口被抑制
6.其他
服务质量限制
防病毒软件和其他限制
包
验证检查失败
那么我们该如何解决这些问题呢?
通常网络丢包排查可以根据网络架构排查、七层模型排查等,排查步骤如下:
1. 检查是否是用户终端问题造成的丢包,如(网卡、杀毒软件、操作系统等)。可以直接使用其他正确的方法。
更换为普通终端设备,观察网络丢包问题是否依然存在。如果存在,则执行步骤2。如果不存在,则调查结束。
变得。
2. 长ping用户网关,观察丢包情况。如果出现丢包,则判断为二层丢包,执行步骤3。如果不是
如果有丢包,则确定丢包为三层丢包,执行步骤7。
3. 检查接入交换机是否存在链路震荡。如果Ping报文所经过的端口反复Up/Down,就会导致Ping报文不通
丢包情况。在用户视图下打开调试开关: 、 。如果有港口
如果状态发生变化,请检查端口速率配置和端口双工模式是否正确,以及对端端口的相关属性配置是否正确。
如果一致,可以尝试通过插拔或更换网线或更换光模块的方式解决问题。如果ping包所经过的端口没有异常,则执行以下步骤
4.
4. 检查交换机是否存在环路协议震荡。检查设备是否启用了STP等环路协议。如果存在循环协议,
摆动会影响ICMP报文的转发和处理。如果设备开启了相关环路协议,请在Ping丢包期间反复检查。
检查环路协议状态,确认是否存在环路协议震荡。可以通过检查端口状态是否异常来判断是否是环。
道路协议引起的震动。如果有问题,请修改并观察是否存在丢包。如果不再出现丢包现象,则故障排除完成。如果还是
如果出现丢包,请执行步骤5。
5.检查开关
端口是否存在丢包、误包情况。执行命令并反复检查端口是否有
数据包丢失计数或其他错误数据包计数增加。通过丢包计数可以看出端口流量是否拥塞。如果有人群
如果端口被阻塞,请配置增加端口当前缓存,观察是否还存在丢包。如果丢包现象消失,则故障排除成功。如果丢失
如果仍然存在丢包现象或者端口不拥塞,则执行步骤6。
6. 检查交换机CPU占用率是否过高。使用命令 cpu-usage 查看 CPU 使用情况。请相应地显示结果。
法官。使用cpu-命令查看上送CPU的报文统计信息,判断是否报文过多
对于来不及处理而被丢弃的协议报文,请检查网络是否受到攻击。如果存在攻击,可以配置攻击溯源惩罚。
或者采用本地攻击策略黑名单来处理。处理完成后,观察是否还存在丢包现象。如果没有,请排除故障。
如果CPU占用率高的问题仍然存在或者网络没有问题,请执行步骤7。
7. 使用命令根据端口报文收发状态判断三层网络中丢包的位置,执行步骤8。
8. 检查设备是否存在路由震荡,观察目的IP 路由的下一跳信息、出端口信息是否发生变化。
如果变化频繁,需要检查是否存在IP地址冲突、端口震荡等问题。如果出现问题,按照原网络规则进行
按照计划进行修改,观察修改后网络是否仍然丢包。如果丢包现象消失,则故障排除成功。修改后丢包
如果仍然存在,或者路由没有振荡,则执行步骤9。
9. 检查是否存在ARP振荡。观察ARP是否震荡,包括MAC、VLAN、出端口是否有变化。通常较旧
老化时间从20分钟开始慢慢缩短。如果ARP老化时间很快刷新到20分钟,则说明ARP已经刷新。
建议检查是否存在IP地址冲突或环路。如果出现问题,请按照原网络规划进行修改,修改后观察。
网络中是否还存在丢包现象?如果丢包现象消失,则故障排除成功。修改后仍然存在丢包,或者ARP不震荡。
摇摆,转到步骤10
10. 检查ICMP报文的CPCAR是否有丢包。使用 cpu-type icmp all 命令
命令,反复检查是否有CPCAR丢包,观察ICMP报文是否有丢包(Drop)。如果有 Drop 计数,您可以调整
适当放大CPCAR值,使ICMP报文能够正常发送和接收。操作完成后,观察是否还存在丢包现象。
如果不存在,则故障排除成功。如果仍然存在或者CPCAR没有问题,请转至步骤11。
11.检查CPU使用率是否过高。执行cpu-usage命令查看CPU占用率,并根据显示结果进行判断。
使用cpu-命令可以查看上送CPU报文的统计信息,判断是否是入站报文过多。
对于未经处理就被丢弃的协议报文,请检查网络是否受到攻击。如果有攻击,可以配置攻击源惩罚或者本地
采用攻击策略黑名单等方法来应对。处理完成后,观察是否还存在丢包现象。如果不是,则故障排除成功。如果
如果网络中CPU占用率高的问题仍然存在或不存在,请执行步骤12。
12.如果故障仍然存在,请拨打华为400热线或申请华为工程师现场支持
页:
[1]