1 网络丢包时常用的排错思路-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

网络丢包时常用的排错思路

jf_TEuU2tls 来源:浩道linux 作者:浩道linux 2022-10-24 09:20 次阅读

前言

今天浩道跟大家分享硬核网络故障排错干货,主要针对网络丢包时常用的排错思路。让你遇到网络丢包时,不再迷茫!

01

什么是网络丢包

说明网络丢包之前,你需要了解的是收发包的原理。

数据在 Internet 上是以数据包为单位传输的,单位为字节,数据在网络上传输,受网络设备,网络质量等原因的影响,使得接收到的数据小于发送出去的数据,造成丢包。

了解了收发包的原理,可以了解到丢包原因主要会涉及⽹卡设备、⽹卡驱动、内核协议栈三⼤类。

e4ac3a0e-532f-11ed-a3b6-dac502259ad0.png

在文章开头说到一点,网络丢包是在使用Ping对目的站进行询问时,数据包由于各种原因在信道中丢失的现象。

Ping命令使用了ICMP回送请求与回送回答报文。

ICMP回送请求报文是主机或路由器向一个特定的目的主机发出的询问,收到此报文的机器必须给源主机发送ICMP回送回答报文。

这种询问报文,是用来测试目的站是否可到达以及了解其状态。

需要指出的是,Ping命令是直接使用网络层ICMP协议的一个例子,它没有通过运输层的UDP或TCP协议。

网络丢包是网络中常见的故障之一,它会引起网速降低甚至造成网络中断。

发生网络故障在所难免,但是如何快速隔离和排除故障是网络工程师应该具备的基本素质。

02

常见的丢包故障现象+处理方法

01 网络数据包发送时通时断,丢包严重

【故障现象】

通常故障发生时,该方向网络出现震荡性中断。使用Ping命令测试,发现在一段时间内数据包发送延时比正常值略高,间隔一小段时间数据包又全部丢失,丢包率超过60%,丢包曲线成规则状,网络服务基本不可用。

【故障分析】

在局域网中引起网络发生振荡性时断时通,一般可能是由于互连的交换机中的某两个交换机间出现了环路,或者某个交换机的两个端口直接相连。

这样就会造成局域网的生成树协议构建失败,不断重复检查并试图构建新的生成树网络,从而导致网络振荡性通断。

同时,伴随着交换机间不断重复地发送广播包,就会形成“广播风暴”,使交换机负担过重,网络传输通道严重被堵塞,无法正常的处理通信数据。

环路虽然可能出现在某个接入交换机上,但会影响整个以三层交换机为核心的局域网的稳定运行。

【故障处理】

当发现网络数据包发送时通时断,丢包严重,特别是整个单位或整个楼层出现振荡性中断现象时,则可以判定应该是该单位的某个交换机上出现了环路所致。

作为网络管理人员应首先查看各接入交换机的指示灯闪烁状态,通常出现环路状况会指示灯会急速闪烁,次数每秒4次以上,所环交换机更为突出。

逐个拨出交换机级联接入网线,同时实时监控交换机状态,在拨下某端口网线后,交换机指示灯恢复正常状态,再进一步查找,会发现该连接线的末端有线路形成环路,清理该网线后,网络恢复畅通。

02 网络数据包发送超时现象严重,时有不规则丢包

【故障现象】

网络突然出现严重堵塞,日常办公程序不能正常运行,打开网页速度缓慢,有时会因超时而中断。未发现网络设备有任何问题,该网络中有几台计算机在入网后速度明显变慢,在禁用网卡或者中断网络后恢复正常。

【故障分析】

首先,在一台用户终端上ping网关测试,结果可以ping通网关,但是数据包发送超时现象严重,丢包率30%左右,丢包不规律。

其次,登陆用户交换机,运行arp -a命令,发现网关IP和网关MAC地址指向正确。

通过上面的测试基本排除网络设置错误以及ARP欺骗,丢包表现了一定的随机性而没有连续性和振荡性的通断,基本排除网络环路问题,初步判断这种现象可能是病毒攻击等引起的。

为此,需要进一步获取ARP信息、网络中传输的原始数据包等信息。

再次,部署抓包分析。在该交换机上配置镜像端口,并将维护终端接到此端口上,启动网络协议分析工具(sniffer)捕获分析网络的数据通信,约10分钟后停止。

在网络分析系统主界面左边的节点浏览器中发现,网络中可能存在伪造IP地址攻击或自动扫描攻击。

选择连接视图,发现在10分钟内,网络中共发起了12000多个连接,且状态大多都是客户端请求同步。

据此,断定网络中存在自动扫描攻击。

最后,详细查看连接信息,发现这些连接大多都是由同一主机发起,选中任意一个连接,选择数据包视图,查看传输数据的原始解码信息,发现这台计算机正在主动对网络中其它主机的TCP 445端口进行扫描攻击,可能是主机感染病毒程序,或者有人正使用扫描软件。通过分析图表视图,进一步确定主机肯定存在自动扫描攻击。

【故障处理】

找到问题根源后,对主机进行隔离,经过一段时间的测试,网络丢包现象有所缓解,但没有从根本上解决问题。

于是再次启动网络协议分析系统捕获并分析,又发现了1台相似情况的主机。据此基本可以断定两台主机都是感染了病毒,且该病毒会主动扫描网络中其他主机是否打开TCP 445端口,如果某主机打开该端口,就攻击并感染这台主机。

如此循环,即引发了上述的网络故障。立即对新发现感染病毒的两台主机进行物理隔离,网络通信立刻恢复正常,再对该终端进行杀毒处理。

03 网络数据包发生严重延时现象,下载、浏览等服务不能正常使用

【故障现象】

局域网内部日常数据共享正常,但是出局浏览外网和下载数据时速度明显降低,使用Ping命令发现到某个方向网络时延特别大,甚至有少量丢包现象。

【故障分析】

一般通过telnet远程登陆到该方向的交换机,以华为系列交换机为例,输入下列命令:

#Display cpu 查看交换机CPU利用率#Display memory 查看内存利用率

发现两者都非常高,再通过输入命令 #Display interface端口号,检查各端口下的数据流。

对其数据流进行抓包分析,发现多线程指向某网站电影栏目,为避免影响整个网络的畅通,对所接入交换机进行处理。

发现其中的两个端口数据流量特别大,远高于正常使用的网络流量。对其数据流进行抓包分析,发现多线程指向某网站电影栏目,为避免影响整个网络的畅通,对所接入交换机进行处理。

【故障处理】

进入该端口配置界面下,输入Shutdown命令,强制关闭该端口使其断网,联系该终端使用人员,令其终止下载进程后,再恢复其网络。

写在最后:

最后想补充一点,很多网工用Ping命令来检测丢包情况,但其实除了Ping,常用的tracert,nslookup 都可以用来判断主机的网络连通性。

而且 Linux 下有一个更好用的网络联通性判断工具,它可以结合ping nslookup traceroute 来判断网络的相关特性,这个命令就是 mtr。

mtr 全称 my traceroute,是一个把 ping 和 traceroute 合并到一个程序的网络诊断工具。

traceroute 默认使用 UDP 数据包探测,而 mtr 默认使用 ICMP 报文探测,ICMP 在某些路由节点的优先级要比其他数据包低,所以测试得到的数据可能低于实际情况。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络
    +关注

    关注

    14

    文章

    7553

    浏览量

    88724
  • 路由器
    +关注

    关注

    22

    文章

    3728

    浏览量

    113697
  • 数据包
    +关注

    关注

    0

    文章

    260

    浏览量

    24384

原文标题:出现网络丢包时,无计可施?看看这篇吧!

文章出处:【微信号:浩道linux,微信公众号:浩道linux】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    常见的网络故障定位⽅法

    本期分享一个比较常见的⽹络问题--。例如我们去ping⼀个⽹站,如果能ping通,且⽹站返回信息全⾯,则说明与⽹站服务器的通信是畅通的,如果ping不通,或者⽹站返回的信息不全等,则很可能是数据
    的头像 发表于 12-07 09:48 1807次阅读
    常见的<b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>故障定位⽅法

    网卡

    网卡率(Loss Tolerance或packet loss rate)是指测试中
    发表于 12-26 12:09 1302次阅读

    网络数据的原因及摄像机的原因

    不少人在使用网络和监控摄像系统的时候都有遇到过数据的情况,数据的原因是多种多样的,以下就为大家介绍一下
    的头像 发表于 01-11 09:27 1.3w次阅读

    网络排错的基本步骤与案例

    网络故障排错我们在实际项目中都可能会遇到,遇到问题后,需要有清晰的解决思路,才能够不慌,快速的把问题找出来,
    的头像 发表于 03-02 09:42 5826次阅读

    Linux应用的延时和模拟

      本文将要介绍的是 RHCA 中的一个 BDP 的测试,这也是公司很常用的一种延时和的模拟,你可以测试你的应用软件在不同的情况下的性能,也可以测试你 tcp/ip 调优后是否
    发表于 04-02 14:38 484次阅读

    常见的云网络故障定位⽅法

    本期分享一个比较常见的⽹络问题--。例如我们去ping⼀个⽹站,如果能ping通,且⽹站返回信息全⾯,则说明与⽹站服务器的通信是畅通的,如果ping不通,或者⽹站返回的信息不全等,则很可能是数据
    的头像 发表于 02-23 11:30 4450次阅读
    常见的云<b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>故障定位⽅法

    Linux优化实战:如何分析网络的问题

    所谓,是指在网络数据的收发过程中,由于种种原因,数据还没传输到应用程序中,就被丢弃了。
    发表于 01-13 13:57 969次阅读

    深入分析Linux网络问题!

    那到底是哪里发生了呢?排查之前,我们可以回忆一下 Linux 的网络收发流程,先从理论上分析,哪里有可能会发生。你不妨拿出手边的笔和
    的头像 发表于 04-21 09:09 1110次阅读

    深入分析Linux网络问题

    所谓,是指在网络数据的收发过程中,由于种种原因,数据还没传输到应用程序中,就被丢弃了。这些被丢弃的数量,除以总的传输
    的头像 发表于 05-04 15:08 1393次阅读
    深入分析Linux<b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>问题

    如何检测常用这两种方式

    重传是数据通信应用里面一项非常重要的功能,特别是在无线通信中是一项决定通信协议先进程度的指标。今天主要着重介绍如何检测,之后再介绍重传机制。如何检测
    的头像 发表于 08-25 08:22 1976次阅读
    如何检测<b class='flag-5'>丢</b><b class='flag-5'>包</b>?<b class='flag-5'>常用</b>这两种方式

    基于V682-SONiC交换机的实现网络检测的可视化

    网络网络通信中较为常见的故障,越早获取到信息和
    发表于 11-09 09:27 1321次阅读
    基于V682-SONiC交换机的实现<b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>检测的可视化

    网络问题解析

    什么是 数据在Internet上是以数据为单位传输的,单位为字节,数据在网络上传输,受网络设备,
    的头像 发表于 11-09 15:10 908次阅读
    <b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>问题解析

    网络故障如何定位

    引言 本期分享一个比较常见的网络问题--。例如我们去ping一个网站,如果能ping通,且网站返回信息全面,则说明与网站服务器的通信是畅通的,如果ping不通,或者网站返回的信息不全等,则很可能
    的头像 发表于 11-10 11:27 1274次阅读
    <b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>故障如何定位

    网络问题分析

    通常会带来严重的性能下降,特别是对 TCP 来说,通常意味着网络拥塞和重传,进而还会导致网络延迟增大、吞吐降低。 一、 哪里可能
    的头像 发表于 11-13 11:24 1007次阅读
    <b class='flag-5'>网络</b><b class='flag-5'>丢</b><b class='flag-5'>包</b>问题分析

    网络率正常范围及其影响因素

    网络中,数据是以IP分组的形式传输的,每个数据都有一个唯一的标识符。当接收方未能收到发送方发送的数据时,就称为发生了
    的头像 发表于 12-29 14:45 6126次阅读