听说DPU也要讲政治了?对的~
夏老师好好玩~要做一个政治正确的DPU哦[1], 那么渣跟着一起搞点破坏,还是… 写点建设性的呢?
其实渣在前几篇文章<DPU和云操作系统>以及<谈谈阿里云的CIPU>都谈到过这个问题,但还是扛不住夏老师这样的..
以搞破坏的角度来接着写:如果给你30秒钟的时间,如何給投资人说明DPU是什么,可以做什么? 国内外所有的商用DPU公司的CEO、CTO估计都讲不清楚… 天天瞎扯什么数据中心税,深怕别人不知道你在抽人家的智商税?数据中心特别是云数据中提升效率的地方多的去了,因为你无法在现实生活中找到一个恰当的例子说清楚。
那么比起喷子搞破坏,说点建设性的(来自于今年2月初写的《DPU和云操作系统》):
大领导们(CPU)的时间很宝贵吧,所以一般来说都会有自己的助理,或者是一些大型的机构都有负责Operation的团队,即便是传统的企业也有办公室主任的岗位。而DPU恰恰就是在干这个工作的。而基于这样的视角就会明晰DPU的职责了,什么该做什么不该做点到为止。
另一篇谈到CIPU的时候:
记得前段时间读过<置身事内>谈到:“凡属事者如客,部署如车,我辈如御,堂司官如骡,鞭之左右而已。” 意思是讲衙门就像车,来办事就像坐车,当官的是骡子,我们才是车把式,决定车的方向。正如我在前文《DPU和云操作系统》的一个比喻,CIPU的本质不是简单的替代CPU,而是从组织架构上来看,”实际的权威来自于信息优势,单位领导(CPU)虽有形式权威和最终决定权,但具体工作大都要求专业知识和经验,所以专职办事的人员(GPU/DSA)实际权力更大。”
信息的复杂性和权力分配是一个普遍的问题,在各国政府中,资深技术官僚都有信息优势,在很多事务上的实权是大于领导的。这样的解释似乎就可以讲清楚CIPU的定位了,本质上它是从组织结构上提供一种激励相容的机制,需要下级(XPU)去发挥主动性和创造性来调动资源去达成,所以整合飞天操作系统是必然。
回到正题上,从云的角度来看,夏老师说的:
这么大一个数据中心,CPU是买的、DDR是买的、SSD是买的,而且供货渠道千奇百怪,任何器件出任何问题都不奇怪。这种基础下,如何能做到安全、容错、快速的资源调配?基层组织建设!如果把数据中心当做一个国家,那么DPU就是国家政府把控全局的一个个街道办。就像疫情来了,把控动员能力强的国家或者城市,嗯,说隔离就隔离了,说封城就封了,能力差的,躺平喏。当然,很多人不喜欢这种把控力,但那本质其实是疫不够烈。换位思考一下,你如果是cloud的运营者,扪心自问,面对稳定大于一切的KPI,你想不想要中国政府对街道办级的把控力?
那么另一个维度就是躺平和经济发展的关系, 稳定是一方面,而云服务成本的全链路优化则是另一方面, 那么简单的把DPU看作讲政治的街道办就不一样了,因为还要去看很多“既要,又要,还要,并且”的事情.
既然是基层机构,云本身的KPI维度也会越来越的,那么基层自然也会参与到考核之中,随着经济下行自然会把KPI越加越多,同时越来越多的任务也逐渐开始变为政治任务,一丁点的业务没处理好,都可以被扣上一个懒政的帽子。这才是DPU们最大的难题。所以这一点上来看,为什么要搞基层党建和为什么一个合格的cloud运营者,一定要通过能把控的DPU获得对整个cloud深入到毛细血管的把控力。 本质上是相通的。
这个问题的本质就是云计算中对算力的分权和激励的问题,所以渣最近在读的一些书也可以分享给大家,
连接就不留了,本来是为了方便读者找到书,却被人以为带货,《置身事内》从宏观的角度讲了政府在整个经济发展中的作用,然后《分权与央地关系》讲述了从分税制改革前后到现在的央地矛盾的一系列论文集,以及国外的一些央地治理方式的调研,而《县乡中国》则是非常基层的视角解析基层组织上面临的一系列挑战和激励相容的一些实践。
而另一个话题则是最近偶然间看到一些关于“自闭症”的某韩剧,从而开始关注阿斯伯格征的一些人, 而GPU和未来的很多DSA都将成为带有鲜明阿斯伯格征的个体。
从体系架构而言,这些XPU对于体系结构和沟通方式的认知是完全不同的,而作为常人(冯诺依曼架构的CPU)在这种背景下,如何让XPU摆脱传统的通信和”社交”压力?RDMA只是一个暂时的方法,但是怎么看怎么都是让GPU故作正常的相处方式,也不难解释nVidia为啥要买下卖螺丝来做一些事情了,可惜卖螺丝自己却没有耐心去了解GPU,或者更高层次的算力。再给一点建设性的意见就是GPU自己的架构会随着未来AI模型本身的变化而变得效率越来越低,至于为什么就不多说了。
结语
生活中有太多有趣的东西,分析类比借鉴以及思考推理并看透本质,正如我一贯跟同事们讲的, 一个初级的架构师通常只会把自己不知道的当黑盒,中级的架构师通常会了解一些不知道的组件并把它当成灰盒,而高级架构师直接会把那玩意折腾成白盒。最顶级的架构师会一把火把所有的东西烧成骨灰盒,然后结构完了再开始造物。
这一代以果金属和RDMA配合VPC网络为代表的DPU生意伴随着Pensando上岸已经结束了,当然某些厂还可以跟着国资云再吃一小块肉,所以迫不及待的开始搞白皮书搞测试标准为集采做准备。但国资云就不考虑成本么?也请这些“运营商”们多一些“服务提供商”的视角,多一些自己成本运营的考量。
至于未来是什么?不是Intel的IPU,也不是nVidia的DOCA,是算法的艺术,是端到端全链路成本优化的需求,是基层组织(DPU)和中央(操作系统)双向激励的过程,是应用百花齐放的未来。
当然对于一些看不透的人也懒得技术扶贫了,虽然有句话叫再穷不能穷教育,但还是留下一句话自勉:人蠢就得多读书…
Reference
[1]
要做一个政治正确的DPU哦: https://zhuanlan.zhihu.com/p/550599378
《听说DPU也要讲政治了?对的~》来自互联网,仅为收藏学习,如侵权请联系删除。本文URL:https://www.bookhoes.com/4409.html