随着云计算的发展,在数据中心网络中服务器虚拟化技术得到广泛应用,但服务器在迁移时,为了保证迁移时业务不中断,就要求不仅虚拟机的IP地址不变,而且虚拟机的运行状态也必须保持原状(例如TCP会话状态),所以虚拟机的动态迁移只能在同一个二层域中进行,而不能跨二层域迁移,这就要我的二层网络足够大。而传统的二层技术,不论是通过缩小二层域的范围和规模来控制广播风暴的规模(VLAN, Virtual Local Area Network)亦或是阻塞掉冗余设备和链路来破环(xSTP, Spanning Tree Protocol),网络中能够容纳的主机数量、收敛性能以及网络资源的带宽利用率对于数据中心网络而言是远远不够的。
此时,轮到华为CE系列交换机大显神通了,提供了多种解决二层扩展能力技术,包括了基于设备虚拟化的堆叠以及M-LAG(Multichassis Link Aggregation Group),这些都是构造数据中心基础逻辑网络的关键,下面就让我们来讨论基于不同的场景每种技术的优缺点,哪些设计可能更适合。
一、堆叠组网方案
堆叠是指将多台交换机设备通过线缆连接后组合在一起,虚拟化成一台设备,作为一种横向虚拟化技术,将多台设备在逻辑上虚拟成一台设备,可以简化网络的配置和管理。同时,结合跨设备链路聚合技术,不仅可以实现设备及链路的高可靠性备份,而且可以避免二层环路。相对传统的STP破环保护,逻辑拓扑更加清晰、链路利用更加高效。
图1-1 堆叠示意图
华为CE系列交换机提供的堆叠技术有CSS技术(框式堆叠)、iStack(盒式堆叠),主要典型特征有:
1、 交换机多虚一:CSS/iStack对外表现为一台逻辑交换机,控制平面合一,统一管理。
2、 转发平面合一:CSS/iStack内物理设备转发平面合一,转发信息共享并实时同步。
3、 跨设备链路聚合:跨CSS/iStack内物理设备的链路被聚合成一个Eth-Trunk端口,和下游设备实现互联。
如图1-2所示的数据中心网络中,接入层、汇聚层/核心层通过部署堆叠构造出一个逻辑简单、无环的网络。
接入层使用低成本的CE8800&7800&6800&5800系列交换机来部署堆叠。终端设备(服务器或其他网络设备)双归接入堆叠,可以保证接入链路的高可靠性。
汇聚层/核心层使用高性能CE12800系列交换机部署堆叠,与接入层之间通过跨框链路聚合连接,形成一个无环的网络。
图1-2 数据中心内堆叠组网图
二、CSS框式堆叠和iStack盒式堆叠
2.1、什么是“框式堆叠 CSS”
CSS(Cluster Switch System)= 多台交换机虚拟成“一台框式交换机”
多台交换机通过堆叠链路(Stack/Cluster口)互联
对外表现为:
一个管理 IP
一个设备
统一转发表
类似:
把两台盒子拼成一台“逻辑机框”
关键特征
特性 | 说明 |
|---|---|
控制平面 | 统一(主备控制) |
数据平面 | 分布式转发 |
管理方式 | 单IP统一管理 |
接口使用 | 支持跨设备 Eth-Trunk |
故障表现 | 类似单设备 |
适用场景
核心层
汇聚层高可靠
替代传统双核心 + VRRP
2.2、什么是“盒式堆叠 iStack”
iStack = 盒式交换机的堆叠技术(接入/汇聚常用)
本质原理
多台接入交换机通过:
专用堆叠口 / 普通万兆口
组成一个逻辑设备
关键特征
特性 | 说明 |
|---|---|
管理 | 单 IP |
成员数量 | 通常 2~9 台 |
端口汇聚 | 支持跨设备链路聚合 |
成本 | 比 CSS 低 |
性能 | 相对核心堆叠弱一些 |
适用场景
接入层(办公网、终端接入)
中小规模汇聚
简化运维
2.3、CSS vs iStack 核心区别
维度 | CSS(框式堆叠) | iStack(盒式堆叠) |
|---|---|---|
设备定位 | 核心/高端汇聚 | 接入/中低端汇聚 |
性能 | 高(接近框式交换机) | 中等 |
堆叠链路 | 专用高速 | 可复用接口 |
稳定性 | 更强 | 一般 |
成员数量 | 少(2~4台) | 多(可到9台) |
典型设备 | CE、S7700 | S5735、S5700 |
成本 | 高 | 低 |
与M-LAG的对比
技术 | 本质 |
|---|---|
CSS | 真·虚拟成一台设备 |
iStack | 轻量版 CSS |
M-LAG | 两台设备“协同”,但仍独立 |
CSS属于系统级虚拟化,需要专用链路和严格初始化流程,而 iStack 属于设备级堆叠,配置更简单、灵活性更高。
三、部署方案
通过堆叠(CSS/iStack)技术保证节点的可靠性:一台设备故障后,另外一台设备自动接管所有的业务。
通过CSS+LAG+iStack 部署端到端可靠性架构,打造无间断数据中心,保证业务持续运营。
多台接入层iStack堆叠,2台汇聚层CSS集群堆叠。
接入与汇聚间采用多条10GE或40GE链路全连接,保障链路高可靠。
汇聚与核心间采用高速40GE链路全连接,确保汇聚到核心无阻塞转发。
方案特色:
简化管理和配置
堆叠建立后,多物理设备虚拟成为一台设备,用户可以通过任何一台成员设备登录堆叠系统,对所有成员设备进行统一的配置和管理,使网络需要管理的设备节点减少一半以上。
其次,组网变得简洁,不再需要配置xSTP、VRRP等协议,简化了网络配置。
带宽利用率高
采用链路聚合的方式,带宽利用率可以达到100%(STP会阻塞链路),采用逐流方式负载均衡,支持多种负载分担方式。
快速的故障收敛
相对于STP秒级的故障收敛时间,链路聚合的故障收敛时间可控制在ms级内,大大降低了网络链路或节点故障对业务的影响。
扩容方便、保护投资
随着业务的增加,当用户进行网络升级时,只需要增加新设备即可,在不需要更改网络配置的情况下,平滑扩容,很好的保护了投资。
堆叠技术从低端盒式到高端框式都已经被广泛应用,具备了相当的成熟度和稳定度,估计会给部分读者造成堆叠技术简直堪称完美的错觉,但我们要知道任何技术都不是完美的,就堆叠技术而言,它的不足之处在于:
堆叠的虚拟化局限于单个层次
虽然横向虚拟化技术在一定程度上优化了网络结构、减少了管理节点,但是做的还不够彻底。一方面是横向虚拟化后依然没有减少网络的层级;另一方面是依然没有彻底解决管理节点较多的问题。大规模的数据中心都有高密度接入的特点,有大量的接入交换机,为了可靠性一般是多台接入交换机虚拟化(多是2台虚拟化),这样即使在做了横向虚拟化后管理节点的数量也是相当可观的。假设接入层有40台接入交换机,每两台交换机做虚拟化,那么依旧还是有多达20个管理节点。
堆叠虚拟化控制面多虚一
网络设备虚拟化之后,所有主控平面合一,但是这种合一只能采用主备备份的模式,即只有主设备的主控板正常工作,而其他主控板都处于备份状态。因此,整个系统的物理节点规模就受限于主控节点的处理能力,不是想做多大就做多大的。例如框式设备虚拟化一般为2台,盒式设备一般为16台。目前最大规模的虚拟化系统大概可以支持接入1~2万台主机,可以从容应付一般的中、小型数据中心,但对于一些超大型的数据中心来说,就显得力不从心了。