安视交换机(RS系列)

信锐技术安视交换机除了满足传统交换机的数据高速转发需求之外,还解决了传统交换机的快速部署、后期运维、价值单一等难题,具有瘦模式零配置上线、图形化集中配置所有交换机、一键替换老旧设备、可视化交换机状态,以及提供更多的安全增值特性,包括网络安全画像、终端安全画像、账号安全画像,让IT网络运维更安全、更简单、更有价值!
SW3.3 - SW3.7
安视交换机(RS系列) 文档 故障案例FAQ 交换机网络环路识别和问题定位
{{sendMatomoQuery("安视交换机(RS系列)","交换机网络环路识别和问题定位")}}

交换机网络环路识别和问题定位

更新时间:2024-09-29

一、环路来源

以太网是一个支持广播的网络,广播包在网络中以泛洪的形式被送达到网络的每一个角落,以保证每个设备都能够接受到它。在带宽允许的情况下,每个交换机在接收到广播报文以后,都会向除接收端口以外的其他所有接口转发这个广播包。 环路中一个广播报文被反复转发了千万次,产生了广播风暴并且很快达到或接近端口线速,并迅速消耗链路带宽。根据转发规则,这些广播报文不仅仅只是在环路上无限转发,环路设备还会向其他端口转发一份,这样整个网络中都充斥着大量重复广播报文。如果全网络都采用千兆端口互连,那么几乎每一条链路上都充斥着1000M/s的广播报文,正常的数据报文将很难再获得转发的机会。

 

网路环路一般都和网络变动相关,需要先从近期的网络变动排查起。

1. 是否由于近期施工或者客户操作操作引入环路。      

如果环路问题是由于近期施工操作引入,可以和施工方确认,了解施工的过程,特别是新增线路连接的细节,结合拓扑结构,确认后排出物理环路。

2. 是否由于近期修改配置引入的环路,重点检查端口或环路相关的操作,比如开启端口,修改生成树等等。

 

典型环路场景1:本设备自环路

前置条件:交换机未配置生成树协议或环路检测协议。

问题现象:端口出方向和入方向流量持续增加。

问题原因:端口自环或者链路环回。

典型环路场景2:下游设备环路

前置条件:交换机未配置生成树协议或环路检测协议,本设备未环路。

问题现象:端口入方向和出方向流量持续增大。

问题原因:下游设备环路。

 

典型环路场景3:破环协议报文转发失败

前置条件:设备配置单端口防环、生成树、Smart-Link等破环协议。

问题现象:一段时间收敛正常,一段时间收敛失败,或持续震荡。

问题原因:破环协议报文转发失败,反复超时震荡。

 

二、环路现象

所有故障皆“事出有因”,故障的发生一定是在一个稳定的正常运行的网络中,某一网络环节发生了变化而引起的,这些诱发网络产品生故障的变化包括:

网络调整:包括但不限于组网调整、配置修改、升级割接等操作;

网络环境发生变化:包括但不限于网络风暴、特定节日/促销活动/智能终端导致用户行为变化,网络设备电源/温度环境发生变化、线路被切断等影响、洪水/火灾/地震/雷击等外界不可抗力;

网络设备发生故障:包括但不限于软件发生缺陷、硬件老化故障(单板异常、光纤光模块故障)等。

所有这些诱发故障的因素绝大多数都有其“外在异常表现”,具体会反映在特定设备的告警、日志、流量统计、端口状态等信息中。

 

网络中出现二层环路通常会有很多现象,如果分析现网问题发现存在以下异常表现中的一个或者多个,则网络中存在二层环路可能性较大。

 

三、环路排查

判断网络中是否存在二层环路,一般可以使用查看接口带宽流量、查看MAC漂移告警、部署环路检测方法进行确认。最好的方式就是直接进行MAC地址漂移检查。

1、检查端口流量是否存在异常,如果存在异常流量则有可能会发生环路

2、检查MAC地址是否存在漂移,如果存在漂移情况基本可以实锤存在环路

3、开启环路检测看是否有端口会被阻塞。

 

1、流量是否存在异常

流量是否异常:控制器和交换机可以在web界面看到流量的历史情况和实时记录,有流量突然增大的、具有一定持续性的就可以怀疑环路问题

控制器:

瘦模式交换机: 

胖模式交换机:

框式:show int gig X/X

2、MAC地址是否存在漂移

安视交换机:需要工程师远程协助。

注:如果安视交换机下联存在无线网络,此处就算存在pending的标记也不一定是环路,也有可能是终端漫游造成的,我们需要观察MAC地址是否在不同的端口上来,终端是否在控制器上存在漫游的情况发生。

框式交换机 框式核心:

1、通用方法: 多次刷新ARP表和MAC地址表查看是否存在MAC地址从不同的端口上学习上来 show mac address-table <mac>、show arp

2、特定型号版本 S7506E&S7510E(4.3.1A_98418)和S7503E(4.1.3A_98498)版本之后支持MAC地址漂移检测,S8514后续会支持,S7503\S7506\S7510等设备不支持。

mac地址漂移检测功能命令:mac address-table notify mac-move syslog

3、环路检测是否有阻塞端口 

在安视交换机下联口开启环路检测功能

环路检测:为了防止环路对网络造成严重影响且可以使发生问题的接口处于受控状态的一种检测技术

环路检测的原理:      

开启环路检测的接口会周期性(1-10秒,管理员可以手动设置)向外发送环路检测报文,若交换机收到自己发出去的环路检测的报文(无论是哪个接口发出去的)则认为出现环路,交换机会执行管理员设置的策略来断开环路。        

1、如果检测报文被发出去的端口又收到了则认为本接口或者本接口下面的接口出现环路        

2、如果检测报文被其他接口收到了则认为是发送和接口端口或者是发送和接收接口下的网络出现环路

 

处理方式:      

发现出现环路之后,则可以执行阻塞端口、关闭端口、退出环路vlan三个动作来断开环路      

自动恢复时间(从动作执行开始计算):1-100分钟管理员可以手动设置

 

应用场景:      

直连PC的交换机接口 注意事项:

1、上联口不要开启环路检测,可能会造成交换机掉线。

2、交换机之间开启生成树

3、若开启环路检测的交换机下联有多台交换机时若下联设备出现环路我们设备可能检测不到 如果下联设备过多,且在造成环路的情况下,我们环路检测的报文可能会无法传递到我司设备上,因此可能存在检测不到的情况出现。

4、若下联设备已经出现环路那么开启环路检测之后也有可能无法检测出环,因为下联设备已经出现环路若由于环路问题导致接口带宽跑满,那么我们检测报文有可能会收不到。

 

环路报文:

1、交换机自己无论从哪个接口发出去的环路测试报文源MAC地址

2、环路检测报文会携带端口编号因此可以检测出环路出现的端口不变

 

四、环路破除 

二层环路会在短时间内形成广播风暴,对业务有严重影响,甚至会导致业务中断。在确认网络发生异常环路后,可以通过如下方式快速进行破环,以恢复业务。

1、梳理网络拓扑并识别环路。 成环的网络拓扑一般较为复杂,可以寻求到网络拓扑结构全图,具体到网络的VLAN规划信息,每台设备名称、系统MAC、管理IP,本端端口名称、对端端口名称。 完整的拓扑信息是解决环路问题的首要条件,如果没有拓扑图,需要从发现环路的设备,通过逐跳登录,记录设备信息、端口信息和VLAN信息,手动绘制完整的拓扑。

2、紧急破环 紧急破环又称手动破环,当客户业务受到严重影响时,需要使用此方法尽快恢复业务。可以通过如下三个方法紧急破环。

(1)shutdown成环端口:Shutdown已经成环的物理端口,也可以达到破环的效果。

(2)开启环路检测(上联口不要开启)

(3)开启生成树:会造成短暂断网情况  

 

五、确认业务已经恢复

通过Ping等操作测证网络通信质量,并观察现网业务是否已经恢复。环路拓扑存在冗余链路和配置,因此环路破除后业务一般会自行恢复。