论文选登
提高轨道交通方案可靠性方法的研究
发布时间:2019-2-26  作者:吴世奇  来源:《中国高新科技》杂志社  浏览量:1534
摘要:现有轨道交通方案的核心设备既为DHCP-server,又为整网认证设备,核心设备性能和可靠性对于整网而言至关重要。文章提出“N+1”台核心设备分布式热备,DHCP地址分配和认证分散到各核心设备上,避免某核心设备故障或性能瓶颈而影响乘客上网体验。在汇聚设备上,基于REUP均衡分割原理,实现用户均衡地分配到各台核心设备上,使核心设备资源均衡充分使用,最终满足地铁高峰期车载乘客在快速迁移过程中由于用户认证频繁迁移而对核心设备高负载和高可靠性的要求。 关键词:轨道交通方案;分布式热备;均衡分割;REUP;DHCP 

1 背景技术

地铁网络具有用户量大、流动频繁等特性,给网络可靠性技术带来极大挑战。现有交通方案Supvlan+VRRP+WEB认证为核心技术,网络规划:认证上收到网络核心,汇聚设备为地铁线路控制中心,每台汇聚设备控制12条地铁线路,每台汇聚设备下挂57台接入设备,每台接入设备控制6个地铁站,每个地铁站分配一个Subvlan,每个控制中心规划一个Supervlan,如图1所示。

 

图1 地铁局部网络拓扑图

2 现有轨道交通方案核心设备性能瓶颈及资源使用不均衡问题

当前方案DHCP地址是根据vrrp组来分配,若某个地址池已分配的IP地址超过阈值TH,则新上线的用户会被分配到其他负载较低的地址池中,DHCP-Server轮询所有地址池,最后将符合条件地址池的IP地址分配给用户。这种方法对于已承担大量用户认证的核心设备DHCP-Server压力大,特别是某台核心宕机,大量新用户上线,每一个新用户发送DHCP discover报文,都在所有地址池中轮询一次,导致DHCP-Server性能成瓶颈。从而造成整网中大量新上线的用户无法实时的正确的获取动态IP地址和认证。

另外,现有的技术是由两台核心设备构成2vrrp备份组且互为主备关系来确保负载均衡。但这与Subvlan毫无关系,在极端情况下,可能会出现所有Subvlan的用户均在1NAS上获取地址与认证。在大量并发用户认证下,出现某台或某些NAS负担过重,导致出现用户认证缓慢甚至无法认证问题

因此,在现有的地铁网络环境中,如何保证负载均衡和降低核心设备性能瓶颈的风险,是当前亟待解决的问题。

3 设备性能瓶颈及资源使用不均衡解决方法研究

鉴于上述现有方案的缺陷,本文提出了更加稳定、可靠的技术方案:

方案A:“N+1”台核心设备分布式备份。由“N+1”台核心设备组ERPS环,其中N台中每2台分别各启2vrrp组,即N个用户虚网关,1为冗余核心备机,即用户实网关,所有核心设备通过ERPS环网实现时时热备。当VRRP热备组某台核心设备宕机,其热备组备机会切换为主机,成为双主机,宕机设备上已认证的用户会通过新主机上网。对于新上线用户,采用分布式备份法,首先,DHCP Server为其分配新主机对应地址池的IP地址;其次,当已分配地址数量达到阈值THDHCP Server为其分配实网关对应的地址池的IP地址,并在实网关上认证。

方案B:均衡分割。将站台规划的Subvlan2组,利用MSTP实例功能,其中一组映射为MSTP的实例1,另一组映射为实例2。在汇聚设备上新增REUP协议:可设置其中一个端口为实例1主端口,实例2从端口;另一个端口为实例2主端口,实例1从端口,同时保证主要主端口才会转发用户报文,实现用户均衡地分配到各台核心设备。

3.1 方案A:“N+1”台核心设备分布式备份

如图2所示,本文中N6,共计7台核心设备组ERPS环,其中设备A/BC/DE/F3个热备组,每个热备组中有2vrrp组,即6个用户虚网关(IPvrrp1~ IPvrrp6);设备G做冗余备机(IPG),即用户实网关。规划核心设备C/DDHCP-Server,配置地址池7个(记为地址池1~7),分别与7个网关一一对应,如IPvrrp110.1.0.1/16,地址池110.1.0.0/16。其他设备均启动DHCP-Snooping,为该设备下联用户DHCP discover报文封装vrrp虚网关地址并透传到DHCP-ServerDHCP-Server根据discover报文中的vrrp信息,分配对应地址池的IP给用户。

2 “6+1”台核心设备组成ERPS环网

当设备A下联有大量用户上线,新上线用户发送的DHCP discover报文携带的网关信息为IPvrrp1,首先,DHCP Server为其分配地址池1的地址;其次,当地址池1已分配的IP总数达到阈值TH时,DHCP Server分配地址池7IP地址给新上线用户。当6台核心设备中的某台核心设备(如A)宕机,设备B立即切换为主机,即设备Bvrrp1,2的双主机,核心 A上已认证的用户会通过核心B上网;对于新上线用户,其DHCP discover报文携带的网关信息为IPvrrp1IPvrrp2DHCP Server通过bfd检测到核心A宕机,首先为其分配地址池2IP地址,其次在地址池2已分配地址数达到阈值TH后,DHCP Server为其分配地址池7IP地址,并在设备G上认证(以设备A为例,其他核心设备类似,不再赘述)。

下面结合图3和图4,分别在正常和宕机情况下,用户分布式获取IP地址过程给出本解决方案的具体分析。

3 设备下联用户分布式获取IP地址

4 宕机设备下联用户分布式获取IP地址

3.2 方案B:均衡分割

如图1所示,将汇聚设备Subvlan分为2组,其中一组映射为MSTP的实例1,另一组映射为实例2。在汇聚设备上配置REUP协议,其中一个端口为实例1主端口,实例2从端口;另一个端口为实例2主端口,实例1从端口。按REUP均衡分割原理,各实例只有主端口转发;当主端口故障从端口切换为新主端口,立即从新主端口转发。从而实现基于REUPSubvlan的均衡分割和热备,用户均衡地分配到各台核心设备上,避免单台核心出现资源负载瓶颈。

下面结合图5均衡分割和热备过程给出本解决方案具体分析。

5 Subvlan均衡分割过程

301:用户发送报文,接入设备下联为Access口,该报文携带vlanID上送汇聚设备。汇聚设备收到该报文,得到其对应的Subvlan信息。

302:在汇聚设备上配置REUP协议,作用于两个端口。其中一个端口为实例1的主端口,实例2的从端口;另一个端口为实例2的主端口,实例1的从端口。实例由主端口转发,主端口状态为down时,从端口切换为主端口。

303:一半Subvlan映射为实例1,另一半映射为实例2。汇聚设备根据Subvlan映射的实例,查找对应的主、从端口。

304:查看主端口状态是否为up,若为up,步骤305;否则,步骤307

305:用户报文在汇聚设备上由主端口转发至NAS

306:根据用户报文源IP地址对应的NAS(网关),在该NAS上完成认证或上网操作。

307:主端口状态为down,从端口切换为新主端口。

308:查看新主端口的状态是否为up,若为up,步骤309;否则,步骤310

309:用户报文在汇聚设备上由新主端口转发至NAS

310:汇聚设备上两个端口的状态均为down,该用户报文被丢弃

4 结语

综上所述,本方案的核心在于,首先,提出6+1”台核心设备分布式备份,其中1台为冗余备机,当某台主机出现宕机时,原备机切换为新主机,如果新主机对应地址池已分配的地址数量超过阈值时,则直接跳转到冗余备机分配地址,从而解决核心设备由于地址池间地址轮询导致性能瓶颈。其次,基于REUPSubvlan的均衡分割,使得新上线和已认证用户均衡地分配到各台核心设备上,最终达到提高地铁网络稳定性和可靠性的效果。

 

参考文献

[1]P. Jhingran aG. Halwasia.Client Identifier Option in DHCP Server Replies[EB/OL]www.rfc-editor.org/rfc/rfc6842.txt

[2]P.Hallam-Baker.HTTP Authentication: Basic and Digest Access Authentication[EB/OL]www.rfc-editor.org/rfc/rfc2617.txt

[3]朱明程王霄峻网络规划与优化技术[M].北京:人民邮电出版社,2018


收稿日期:2018-09-07

作者简介:吴世奇(1977-),男,福建福州人,锐捷网络股份有限公司工程师,研究方向:网络通信。

 转载本站文稿,务必标注出处。

Copyright 2017 中国高新科技网 All rights reserved.

 主办单位:中国科技产业化促进会  版权所有:《中国高新科技》期刊社

 不良信息或版权问题举报电话:010-8361 1115 纠错邮箱:zggxzz@126.com

京ICP备08104264号-2