从Re:Invent看到的…
Graviton3
AWS Re:Invent 发布了Graviton3,比起其它媒体念指标翻译原文, 渣可能更加关注的是它的设计逻辑,和阿里倚天710单纯的比跑分不同的是,AWS的设计更多的从c7g实例的场景可以看到, 它主要是用于一些计算密集型的场景下替代X86服务器,这些应用主要包括 HPC、EDA、Batch Proccessing, 视频编解码、广告、科学建模、分布式分析和一些基于CPU的机器推理上。然后EFA提供了30Gbps的带宽,不知道会不会是直接把Graviton3的几个核用来做了Nitro,而且Graviton3的核心数、Cache结构都没有公布。
但是从性能提升来看,25%的指标提升核浮点2倍的性能都以及主要针对HPC场景来看,都指向了Arm Neoverse V1和相应的SVE。
而且从架构上来看,支持PCIe Gen5-CXL、DDR5、bfloat16以及SVE,的确是在一些计算密集型的场景下可以和Intel竞争,而且相应的这些HPC和AI软件生态也更容易做一些。所以这个思路上和阿里走N2去做通用云计算ARM替代的思路是有些不同的,当然阿里还有肩负起很多国产替代的任务,出现这样的差异也很正常.
而AWS的整个ASIC思路也是非常清晰的,先做基于ARM的Nitro,然后再到CPU。而阿里则是先做了通用多核的ARM CPU是不是以后会倒回来再做神龙就不得而知了, 因为一些唯性能论的观点会阻碍RTC处理而倾向于选择Pipeline。有些话点到为止,no pain no gain..
Trainium
另一个值得关注的是Trainium芯片带来的新实例Trn1,单实例带宽为800Gbps。但是隐约从宣传的Video看到应该是采用了2D-Torus的互联,每个link 200Gbps而构成的。前几天我还在开玩笑说400Gbps DMA都成问题了,你们还搞RDMA,如今AWS单实例800Gbps都有了… 只可惜有些人在卖螺丝的RDMA船上飘的太久了..
非RDMA可以做很多有趣的事情~
Outposts
推出了一些2RU的小机器,这是非常好玩的。相对于某个云混合云方案送的管理节点比客户用的计算节点还多,这样的2RU的解决方案非常不错。
SageMaker
还有一个值得关注的是,SageMaker Canvas这样的低代码ML平台,SaaS +Severless+低代码真的是个趋势.
它号称没有任何经验的用户,也无需编写任何代码,只需用鼠标点击拖拽,即可创建机器学习预测模型。不过渣对于这样AutoML的玄学还是持怀疑太多,人家的假设是没有经验不代表不懂统计学,所以国内像第四范式推出AutoML这样的平台最大的难点还是在客户侧基本的统计思维能力欠缺。
其实无论是AutoML还是Software 2.0 本质上是编程范式的变革,如何通信如何计算的本源问题。一方面,我们看到Intel利用CXL实现Unified Shared Memory并提供OneAPI的编程思路上也挺有趣的
只是内存的解耦和高性能访问可能需要的不是 DPC++ 也不是 oneAPI
而是范畴论,Intel自己已经利用范畴论的思想在划分Scalar Vector Matrix Spatial了但是没有点破这个题目。
正如上一次由微积分带来的各种微分方程而产生的工业革命,未来数十年必定是范畴论这样的结构重建带来的新一轮工业革命。
我们可以注意到一些函数式编程的发展,以往函数式编程因为在单核系统中效率不高和学习曲线太陡,而被工业界束之高阁数十年。而如今你可以看到前端会谈论一些ImmutableJS,还有一些前端的状态机模型例如React的一些state管理都伴随着函数式编程的思想。硬件设计领域Chisel和SpinalHDL的出现也借助了一些函数式编程的思维。而传统的基于C++的一些高级语言编译出来的Verilog似乎普遍反映效率不高。
而这些函数式编程语言和范畴论的思维是否能够让我们重构整个计算体系?渣觉得一定会,只是接下来如何去说服和培训大家学会这样的技能罢了..
《从Re:Invent看到的…》来自互联网,仅为收藏学习,如侵权请联系删除。本文URL:http://www.bookhoes.com/159.html