当我把这个问题抛给AWS计算和网络副总裁David Brown时,他给出的回答是:绝对如此(absolutely)。
这个问题是站在用户视角提出的。相比底层基础技术,如今的企业用户显然更为关注IT系统的顶层应用,尤其是那些能够直接带来业务价值的应用。生成式AI能迅速走红,也正是因为企业的业务负责人看到了大模型的价值,尽管相关技术早已被IT负责人所了解。
虽然AWS给出的回答很绝对,但我仍愿意给这个问题一个开放的答案——毕竟,云服务的初衷就是让客户不用太多操心底层基础架构,而直接使用相关服务。
我们就来看看,在2023re:Invent上,AWS都在关注哪些底层技术,其到底有何价值。
不管是传统应用还是AI应用,算力都是最底层的基础设施。
IDC中国副总裁周震刚预测说,全球AI算力市场规模将从2020年的75Eflops,增长到2027年的1117 Eflops,增长高达15倍;即使是通用算力,增幅也达到了3倍,从2020年的40 Eflops到2027年的117 Eflops。他表示,与算力需求高速增长同步而来的,还有计算服务范式的改变。
在2023re:Invent上,AWS在通用计算和AI计算方面都加快了芯片的更新换代步伐。
在通用计算芯片方面,AWS推出了新一代的ARM处理器Graviton4。与Graviton3处理器相比,其性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上,从而为追求性价比的客户提供了x86处理器之外的选择。
如今,有非常多的厂商在基于ARM开发自己的芯片,但AWS被认为是这一领域是为数极少的成功者之一。这是因为ARM虽然开源,但流片成本很高,而且需要不断迭代,如果没有足够的规模难以支撑。
David Brown介绍说,AWS规模化提供的基于Graviton的Amazon EC2实例种类达150多个,已经构建的Graviton处理器数量超过200万个,并拥有超过50000客户。正是足够的用户规模,促成了Graviton在五年里的四次更新升级。
在AI计算芯片方面,AWS也在加快自研的训练和推理芯片的升级发布,为客户提供Nvidia之外的选择。2023年4月,AWS发布了其第二代推理芯片Inferentia2 。此次宣布升级的是的是第二代训练芯片Trainium2以及相应的实例。与第一代Trainium芯片相比,Trainium2训练速度提升多达4倍,并能在一个集群中部署多达10万个芯片,适合用作生成式AI的基础模型和大语言模型训练。
值得注意的是,无论是通用计算还是AI计算,AWS强调其自研芯片的优势,都是性价比和低能耗。
数据被认为是当今企业的核心资产之一。即使在生成式AI领域,数据仍然是核心竞争力,管理好数据至关重要。IDC周震刚也表示,数据的存储和管理,是与算力同等重要的AI基础设施。
应该说,在数据的存储和治理方面,AWS的产品和服务已经很完善了,那么下一步的发力重点是什么呢?
在数据存储领域,AWS引人注目地发布了一个新的S3服务Amazon S3 Express One Zone,这被认为是数据存储方面仅剩的创新领域之一。顾名思义,这是一个只部署在单一可用区上的存储服务,相比标准版的S3,在牺牲数据持久可靠性的同时,能够带来更高的性能和更低的访问成本。
亚马逊云科技大中华区产品部总经理陈晓建介绍说,其数据访问速度能够提高最多10倍,实现个位数毫秒级的访问;而数据请求成本降低50%,这主要得益于访问成本的降低。
牺牲可靠性、增强性能、降低成本,Amazon S3 Express One Zone适合数据分析类应用,比如机器学习训练和推理、交互式分析以及媒体内容创建等请求密集型工作负载。
在数据治理领域,Zero-ETL是最值得关注的部分。一年前,AWS发布了首个Zero-ETL特性,实现Aurora MySQL与Redshift的Zero-ETL集成功能。此次,Zero-ETL被拓展到了其他数据库服务上,包括Aurora PostgreSQL和 DynamoDB。
亚马逊云科技大中华区解决方案架构部总经理代闻表示,Zero-ETL可以应对那些繁重复杂的数据处理工作,包括生成式AI常见的全文检索和向量搜索,让客户能够轻松地连接和分析数据,而无需构建和管理复杂的ETL数据管道。
不过,仅仅解决不同数据库之间的相互传输,其实只是Zero-ETL的第一步而已。AWS数据与AI副总裁Swami Sivasubramanian承诺,将持续投资于Zero-ETL这一愿景,让客户能够轻松集成来自整个系统的数据,从而专注于发现新的洞见。
Serverless无服务器是一种典型的技术,来让云服务商负责底层基础设施,而用户则专注于顶层应用和业务层面。
由于具备弹性扩展、按需计费、简化管理、快速交付四大特性,Serverless才是真正的云服务。只有全面Serverless化,才能实现当初让云服务如同水电一般简单易用的承诺。
AWS的Serverless化起步于计算服务,如今数据服务也全面拥抱了Serverless。在2023re:Invent上,AWS在Serverless上的新举措,仍然集中在数据方面,包括数据库和数据分析。
其中,Amazon Aurora Limitless,可以自动完成超过单个Aurora数据库写入限制的扩展,支持每秒数百万次写入交易并管理PB级的数据。Amazon ElastiCache Serverless可以帮助客户在一分钟内创建高可用的缓存,并实时进行垂直和水平扩展以支持客户复杂的应用程序。Amazon Redshift Serverless则利用AI预测工作负载,并自动扩展和优化资源,从而带来高性价比。
虽然Serverless被认为是云服务的未来,但其也处于早期阶段,在应用中的占比还不高。而且,只有全面Serverless化,才能最大化发挥这一技术的价值。从这个角度来说,作为一个重要的底层基础技术,Serverless的未来之路仍然漫长。
回到开头的问题:云服务的底层技术还像以前那么重要吗?
对于不同的对象群体,这个问题的答案似乎是不同的。
对于企业的业务部门来说,其显然不愿意关注底层技术,而是要关注业务价值;对于企业的IT部门来说,为工作负载选择最合适的平台,仍是其重要工作之一,但同样希望简化;对于AWS这样的云服务商来说,底层技术创新是其核心的基础工作,一刻也不能放松。
David Brown则强调,底层技术的创新,可以帮助客户降低成本、提升效率,带来更“好看”的财务报表,AWS将继续在此方面投资。