Ruta架构:去中心化的原因

其实很多人对于为什么要利用一个去中心化的协议来重构路由器持有怀疑态度,同时对Ruta的一些底层设计还没有太多的认知。认为去中心化后不就是跟以前没有控制器的时代一样了么?传统的路由器网络通常是一些贪心算法构建的,等同于一个A~n_a_r_c~h~i_s~m状态。而基于控制器的设计方式初期由于A~u_t_o-c-r_a~c~y会带来全网自顶向下决策效率高的优势。
但是随着网络规模的扩大和信息的逐渐不对称,控制器模式在单一数据中心稳定链路的情况下工作没有什么大碍,但是对于多站点全球部署的大规模SDWAN场景则出现了太多的问题,在延迟和抖动以及带宽受限的情况下, 控制器很难对全网进行一致性的策略管理,而控制器放置也会成为一个非常难的问题,例如最简单的两地三中心,然后DCI的接口是通过SDWAN连接的,那么控制器放在哪?很多控制器集群要求相互距离 RTT 50ms以内,那么异地灾备如何选择?
这才是逐渐的想对原有的集中式控制器去中心化的原因。另一个原因是AIOps带来的,我在某司研发AIOps引擎时,发现在园区网络和数据中心网络非常容易对报文进行镜像等操作分析流量, 而广域网Telemetry则是一个非常难的问题,信息需要大规模的压缩处理清洗后才能发送到控制器中,而路径决策计算和模型推理又需要大量的计算资源。所以最终的结果就如同制度的演进,去中心化和分布式一致性协议的引入使得整网的变化在哪?

传统的网工可能只会想到这样一张图,也就是说你无非是把vSwitch放入了主机,和Nicira当年没有太多的区别?
最关键的区别给了终端感知网络(LinkState)和选择的权利(Segment Routing),以及统一的Declarative Policy framework的能力(SDP)

Ruta架构:去中心化的原因

而事实上最关键的一点是,Ruta的路由协议把Linkstate给了主机,任何一个主机都可以通过分布式一致性协议查看到网络的状态,例如延迟:

Ruta架构:去中心化的原因

而丢包率也可以查询到:

把选路的权利交给了主机,把策略控制权利交给了主机
,同时把复杂的YANG模式配置的处理变成了分布式一致性的架构,类似于在网络设备中制定了相关的法律,法律的遵守执行交给了终端执行,而不需要具体的让控制器要求终端做什么, 这也是意图网络中最重要的一环,意图以申明式的方式呈现为网络中的法典,具体的执行下
面你们
各自智能的去做。


这样的框架给终端更多的智能,例如针对数据中心东西向流量的拥塞控制,或者AI训练集群的网络优化等,这个话题过几天有空了我来写写, 如何通过Ruta加速AI训练集群。

Ruta架构:去中心化的原因》来自互联网,仅为收藏学习,如侵权请联系删除。本文URL:http://www.bookhoes.com/1576.html