微波EDA网,见证研发工程师的成长!
首页 > 测试测量 > 测试测量技术文库 > 数据中心网络架构的HA测试

数据中心网络架构的HA测试

时间:10-17 来源:3721RD 点击:

障、板卡故障、设备故障、多设备故障和站点故障。这些故障事件发生的概率依次降低,所以HA测试的关注点主要集中在链路、板卡和设备故障上,这也是数据中心网络HA设计的最基本要求。常用的操作方式为接口的Up/Down 、线卡的拔出/插入、机框的加电/断电等,特殊情况下也可以通过测试仪或被测设备的系统软件功能来模拟HA事件。

2.3 HA测试量化统计

通过HA测试,不仅可以验证被测系统在某些异常情况下是否可以保证功能的可用性,同时也可以通过精确统计得到业务流量中断的量化指标。通过测试仪器构造一定速率的数据报文经过被测系统转发,模拟某些故障情况下的报文丢失并统计出数量,从而计算出流量的中断时间,来衡量被测系统的HA性能指标。计算公式如下:

故障失效恢复时间=(发包端口发包数-收包端口收包数)÷ 链路转发速率

也可以通过L4-L7层测试仪模拟上层业务交互来更直观的了解被测系统在各类异常情况下对业务的影响。如图2所示。


图2 BPS测试仪显示TCP新建连接抖动情况

对于通过测试仪发起或参与的模拟网络事件的测试项,还可以通过测试仪自身提供的高精度采样功能来更加精确统计设备或网络的性能。例如,在通过测试仪发送路由表项来测试设备的路由学习性能时,可以通过如图3所示的高精度采样功能来统计时间。


图3 TestCenter测试仪显示的高精度采样功能

3 数据中心HA测试案例

3.1 IRF典型组网HA测试


图4 数据中心IRF典型组网

如图4所示,这是典型的数据中心网络(接入5120+核心12500)两层拓扑结构,核心层两台S12500采用IRF模式,可以简化网络逻辑结构,提高设备利用效率并简化网络管理。接入层采用5120EI交换机做二层双上行接入,接入层链路为跨机筐链路聚合。出口设备采用SR6600路由器与12500交换机运行OSPF或BGP路由协议,12500与SR6600之间都为双上行三层等价链路。其中,SR6600模拟了广域网出口设备,但在真实场景中使用高端交换机较多。5120EI和SR6600分别连接两个应用层测试仪(构造具有状态特征的UDP和TCP流量)端口。通过对设备故障和链路故障的模拟,可以直观得到组网中应用层业务的收敛时间、IRF和LACP的HA切换时间等。

需要精确统计时,可以用测试仪以标准报文大小模拟跨S5120EI和SR6600的南北向普通三层数据流,并以Full Mesh方式进行测试。记录异常情况下全局系统的丢包数量从而计算HA中断切换时间,重复测试3次记录平均数据,如表2所示。这些数据对于评估网络整体的HA能力,优化应用层业务部署都有重要意义。

普通流量丢包情况(带宽500Mbps,128字节,422297 FPS)


表2 常见的IRF故障模拟和测试数据

通过测试数据可以很直观的了解到整个网络架构中各种应用在不同类型的故障情况下HA收敛的好坏指标。比如表2所示,链路中断的HA收敛时间好于设备重启的,设备重启与交换机主控故障的HA时间相近,交换矩阵故障中断时间最长等等。在了解到这些异常情况对网络的影响程度后,便可以有针对性的通过网络设计和优化配置加以改进,从而增加整个网络架构的HA能力。

3.2 路由典型组网HA测试


图5 数据中心路由性能HA测试组网

图5的测试组网也模拟了典型的数据中心网络。接入层交换机使用两台真实设备,在大规格测试项中会使用测试仪模拟更多的接入交换机。核心设备之间采用普通的三层路由结构,机房或站点间的出口设备"MAN Core"采用一台高端交换机模拟,MAN Core通过多条等价三层链路与内部核心Core1和Core2连接。

初始情况下,测试仪端口1(与Access1相连)发向端口2(与Access2相连)的东西向流量是不通的。在测试仪端口2上发布路由后,等待各设备都学习到路由后才会收到报文。记录测试仪从发布路由到测试仪收到流量的时间差,这个差值就是全网路由学习时间。由于采用传统的测量流量图记录时间的方法误差较大,可以采用TestCenter3.7版本中的高精度采样功能来计算学习时间。如图6所示。


图6 TestCenter高精度采样

为了测试的方便与准确,采用了TestCenter软件中的command sequence功能执行流量、路由及采样触发的操作:

撤销路由->停止流量发送等待10s->清除所有计数->等待5s->开始发送流量->等待5s->开始高精度采样->等待5s->发布ospf路由->触发高精度采样。

command sequence执行完成后,等待高精度采样进行10s,然后点击端口高精度采样视图下的show chart:

红线为开始出发发布路由的时间,蓝色线为流量曲线,测量两个时间的时间差便可得到路由在网络中的学习时间。

Access2相连的测试仪上发布、撤销一条路由,在Access1设备上学习到的时间,

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top