hwyzw 发表于 2024-12-6 09:44:08

网络丢包排查指南:从物理层到应用层的全面故障诊断步骤

    1、物理层

    物理电路接触不良

    光模块故障

    设备硬件故障

    2.数据链路层

    二层环路导致CPU占用率过高

    畸形数据帧直接丢弃(源MAC地址为广播MAC等)

    MAC地址漂移

    MTU值不匹配

    第 2 层攻击

    3、网络层

    负载分担路径局部故障

    消息碎片丢失且无法重组

    三层攻击

    生存时间为0

    防火墙往返路径不一致

    4、传输层

    MSS 不匹配

    5、应用层

    端口被抑制

    6.其他

    服务质量限制

    防病毒软件和其他限制

    包

    验证检查失败

    那么我们该如何解决这些问题呢?

    通常网络丢包排查可以根据网络架构排查、七层模型排查等,排查步骤如下:

    1. 检查是否是用户终端问题造成的丢包,如(网卡、杀毒软件、操作系统等)。可以直接使用其他正确的方法。

    更换为普通终端设备,观察网络丢包问题是否依然存在。如果存在,则执行步骤2。如果不存在,则调查结束。

    变得。

    2. 长ping用户网关,观察丢包情况。如果出现丢包,则判断为二层丢包,执行步骤3。如果不是

    如果有丢包,则确定丢包为三层丢包,执行步骤7。

    3. 检查接入交换机是否存在链路震荡。如果Ping报文所经过的端口反复Up/Down,就会导致Ping报文不通

    丢包情况。在用户视图下打开调试开关: 、 。如果有港口

    如果状态发生变化,请检查端口速率配置和端口双工模式是否正确,以及对端端口的相关属性配置是否正确。

    如果一致,可以尝试通过插拔或更换网线或更换光模块的方式解决问题。如果ping包所经过的端口没有异常,则执行以下步骤

    4.

    4. 检查交换机是否存在环路协议震荡。检查设备是否启用了STP等环路协议。如果存在循环协议,

    摆动会影响ICMP报文的转发和处理。如果设备开启了相关环路协议,请在Ping丢包期间反复检查。

    检查环路协议状态,确认是否存在环路协议震荡。可以通过检查端口状态是否异常来判断是否是环。

    道路协议引起的震动。如果有问题,请修改并观察是否存在丢包。如果不再出现丢包现象,则故障排除完成。如果还是

    如果出现丢包,请执行步骤5。

    5.检查开关

    端口是否存在丢包、误包情况。执行命令并反复检查端口是否有

    数据包丢失计数或其他错误数据包计数增加。通过丢包计数可以看出端口流量是否拥塞。如果有人群

    如果端口被阻塞,请配置增加端口当前缓存,观察是否还存在丢包。如果丢包现象消失,则故障排除成功。如果丢失

    如果仍然存在丢包现象或者端口不拥塞,则执行步骤6。

    6. 检查交换机CPU占用率是否过高。使用命令 cpu-usage 查看 CPU 使用情况。请相应地显示结果。

    法官。使用cpu-命令查看上送CPU的报文统计信息,判断是否报文过多

    对于来不及处理而被丢弃的协议报文,请检查网络是否受到攻击。如果存在攻击,可以配置攻击溯源惩罚。

    或者采用本地攻击策略黑名单​​来处理。处理完成后,观察是否还存在丢包现象。如果没有,请排除故障。

    如果CPU占用率高的问题仍然存在或者网络没有问题,请执行步骤7。

    7. 使用命令根据端口报文收发状态判断三层网络中丢包的位置,执行步骤8。

    8. 检查设备是否存在路由震荡,观察目的IP 路由的下一跳信息、出端口信息是否发生变化。

    如果变化频繁,需要检查是否存在IP地址冲突、端口震荡等问题。如果出现问题,按照原网络规则进行

    按照计划进行修改,观察修改后网络是否仍然丢包。如果丢包现象消失,则故障排除成功。修改后丢包

    如果仍然存在,或者路由没有振荡,则执行步骤9。

    9. 检查是否存在ARP振荡。观察ARP是否震荡,包括MAC、VLAN、出端口是否有变化。通常较旧

    老化时间从20分钟开始慢慢缩短。如果ARP老化时间很快刷新到20分钟,则说明ARP已经刷新。

    建议检查是否存在IP地址冲突或环路。如果出现问题,请按照原网络规划进行修改,修改后观察。

    网络中是否还存在丢包现象?如果丢包现象消失,则故障排除成功。修改后仍然存在丢包,或者ARP不震荡。

    摇摆,转到步骤10

    10. 检查ICMP报文的CPCAR是否有丢包。使用 cpu-type icmp all 命令

    命令,反复检查是否有CPCAR丢包,观察ICMP报文是否有丢包(Drop)。如果有 Drop 计数,您可以调整

    适当放大CPCAR值,使ICMP报文能够正常发送和接收。操作完成后,观察是否还存在丢包现象。

    如果不存在,则故障排除成功。如果仍然存在或者CPCAR没有问题,请转至步骤11。

    11.检查CPU使用率是否过高。执行cpu-usage命令查看CPU占用率,并根据显示结果进行判断。

    使用cpu-命令可以查看上送CPU报文的统计信息,判断是否是入站报文过多。

    对于未经处理就被丢弃的协议报文,请检查网络是否受到攻击。如果有攻击,可以配置攻击源惩罚或者本地

    采用攻击策略黑名单​​等方法来应对。处理完成后,观察是否还存在丢包现象。如果不是,则故障排除成功。如果

    如果网络中CPU占用率高的问题仍然存在或不存在,请执行步骤12。

    12.如果故障仍然存在,请拨打华为400热线或申请华为工程师现场支持
页: [1]
查看完整版本: 网络丢包排查指南:从物理层到应用层的全面故障诊断步骤