科技创新从来都不是简单的线性递进,而是一个多主体参与、多要素互动的过程,其中,由技术进步和应用创新组成的“双螺旋结构”,更是被看作是科技创新的核心驱动力:技术进步为应用创新提供了基础支撑,而应用创新又反过来推动了技术进步。
云计算的发展就完美地诠释了“创新双螺旋”理论。早期,人们希望通过云计算的普及,让计算、存储等资源像水、电一样随取随用;但随着应用的深入,单纯把计算、存储等资源“池化”已经越来越无法满足实际应用需求,于是,从芯片、协议等底层技术创新入手,就成了云计算产业发展的必然趋势。
作为全球云计算的开创者和引领者,亚马逊云科技十多年来已经推出了多种定制化的芯片设计,以帮助客户运行要求更高的工作负载,包括更快的处理速度、更高的内存容量、更快的存储输入/输出(I/O)和更高的网络带宽。
就在不久前的re:Invent2022全球大会上,亚马逊云科技又推出了一系列底层技术更新,这里既包括新一代通用芯片、机器学习推理芯片、虚拟化芯片等,还对核心的底层SRD网络协议进行了创新,从而提升网络性能,这些创新不仅再一次突破技术边界,也进一步提升了云计算的性能。
突破性能极限,从定制芯片开始
20世纪初,随着航海技术的发展,人类先后了许多地球上此前无人到达的区域,南极点成为最后一片人类没有踏足过的处女地。为此,两名探险家罗伯特·斯科特(Robert F. Scott)和罗尔德·阿蒙森(Roald Amundsen)展开了一场危险的竞赛:争做第一个到达南极点的人。
1911年12月14日,阿蒙森率先到达南极点;33天后的1912年1月17日,斯科特也到达了南极点。在此过程中,阿蒙森携带了大量雪橇犬,效率很高;而斯科特携带的西伯利亚小马则根本适应不了南极气候,而机械雪橇也无法工作,燃料桶由于使用锡来焊接密封,锡在极冷的气温里变成了粉末状,导致成桶的汽油全部漏光。
在这一趋势下,亚马逊云科技也在加大对定制芯片的投入,从Graviton到Trainium、Inferentia再到Nitro,亚马逊云科技每一代自研芯片都为客户的各种工作负载提供更高的性能、更优化的成本和更高的能效。这些定制芯片在给客户带来更加卓越的性价比的同时,也在驱动着亚马逊云科技的持续创新。
如今,亚马逊云科技更是全新推出了新一代通用芯片Gravition3E,机器学习推理芯片Inferentia2,以及第五代虚拟化芯片Amazon Nitro5,并推出基于此三款复原研芯片的Amazon EC2最新实例。
采用最新机器学习加速推理芯片Inferentia2的Inf2实例,可以运行高达1750亿个参数的大型深度学习模型(如LLM、图像生成和自动语音检测),并在Amazon EC2上提供最低的单次推理成本;与当前一代Inf1实例相比可提供高达4倍的吞吐量,降低多达10倍的延迟。
据了解,相比于传统的TCP单路径路由网络,SRD(Scalable Reliable Datagram,可扩展的可靠数据包)是亚马逊云科技开发的一种网络协议,专为亚马逊云科技环境中实现一致且低延迟的网络而构建,具备多路径传输、微秒级重传和Nitro芯片提供专用资源三大优势,能够显著降低网络延迟,提高网络吞吐量。
比如,SRD协议能够显著提升亚马逊云科技高性能计算实例采用的EFA网络接口的性能表现,SRD协议还能够有效改善Amazon EBS块存储性能,可减少90%的尾部延迟,并能够将吞吐量提升4倍。
不仅如此,亚马逊云科技还推出了高速虚拟网卡ENA Express。ENA Express以为Elastic Fabric Adapters提供支持的SRD协议为基础,将流量的P99延迟减少了50%,将P99.9延迟减少85%(与TCP相比),同时还将最大单流带宽从5Gbps到增加到了25Gbps,并让企业可以获得更多的每流带宽和更少的可变性。
从芯片到协议,亚马逊云科技在底层技术上的持续创新,已经给云服务带来了性能和效率等方面的巨大提升。首先,亚马逊云科技通过底层技术的创新,进一步夯实了自身在云计算领域的引领者地位,并为云计算产业的创新发展探索出一条新的路径。
其次,亚马逊云科技也通过此举,让客户能够享受到更具性价比的云服务。尤其在数字化转型逐渐进入“深水区”的今天,越来越多的企业开始拥抱云计算、拥抱云原生,而更高性能、更具性价比的云服务,无疑让这些企业可以更加从容地在云上开展业务系统的创新,进一步加速自身的数字化转型进程。