今年上半年,云计算市场热闹异常。
既有老牌云服务商管理层大动荡,引发市场热议;也有各大云服务商推出芯片新品,算力变革加速来临;还有东数西算工程启动,节能降碳成为云服务商们的新命题。算力变革、数据要素化、云原生崛起、低碳云……一连串热门关键词的背后究竟藏着哪些玄机?会对未来市场产生哪些重要影响?
就像有人所言:不要高估事情带来的短期效应,亦不要低估事情所产生的长期影响。上半年的热点事件,是政企成为上云的主力军之后,上云、用云需求新周期的开启,云服务商则进入到全栈技术能力比拼的新阶段,市场竞争的逻辑也在悄然发生改变。
Gartner在上半年发布了《Market Guide for Cloud Infrastructure and Platform Services, China》报告(以下简称:CISP中国报告)。该报告研究范围覆盖公有云、行业云、分布式云以及混合云等市场牵引力较强且用户最为关注的领域,选取了中国最具代表性的云服务商进行调研,为决策者提供市场指南性参考。
与全球版不同,入围CISP中国报告的厂商明显更多,包括阿里云、华为云、中国电子云等均悉数入围。那么,Gartner这份报告透露了哪些关键信息?
第一个重要判断:与国外云计算市场大格局相对稳定不同,中国云计算市场的竞争活跃度显然更强。除了亚马逊云科技等云服务商巨头之外,市场中依然有着很多“新势力”参与市场竞争。比如,国外运营商已经基本退出云计算主流市场,但中国三大运营纷纷加大云计算投入,希望能够在广阔市场中分得一杯羹;又如,中国电子云凭借着PKS技术体系,在政务专属云、国资云、数据治理等细分市场或领域中崭露头角,上升势头明显。
IDC最新数据也佐证了这一判断。《中国公有云服务市场(2021下半年)跟踪》报告显示,2021年下半年中国公有云服务整体市场规模(IaaS/PaaS/SaaS)达到151.3亿美元,其中IaaS市场同比增长40.1%,PaaS市场同比增速为55.7%,但市场领头羊的增长速度却落后于市场平均增长速度;中国电子云等“新势力”的高速增长则令人吃惊。
第二个重要判断:市场竞争的逻辑在悄然发生改变,全栈技术能力是未来云计算市场最大的竞争砝码。早在2020年,Gartner就将之前的《云基础设施即服务魔力象限》调整为《云基础设施和平台服务魔力象限》(即CISP)。Gartner将报告所涵盖的范围从之前的基础设施资源(如计算、网络、存储)扩展到数据库、FaaS、托管应用程序等领域。
Gartner这一变化,这既反映出企业用户采用云服务方式的动态变化趋势,也体现出云服务商全栈技术能力和广泛服务能力的重要性。Gartner CISP中国报告也延续了评估标准,所入围的厂商普遍注重全栈技术能力的构建。
事实上,市场真实情况不会撒谎。以某很早布局云计算的企业为例,过去十年时间投入重金和研发,聚焦的还是CDN业务,始终绕不开“带宽”这个关键词,并无更加亮眼的高阶产品/服务,以至于人们称这类云服务厂商为IDC 2.0。该云服务的真实情况固然反映出过去十年互联网、电商、视频等用户是上云的主力军,但也折射出云服务商们沉溺于拼成本、折扣的尴尬情况。
显然,随着政企成为上云的新主力,拼带宽成本的竞争方式将成为过去式,而像各种数据库服务、数据仓库、ML/AI、Serverless、FinOps等高阶产品/服务才是政企用户所亟需的;另一方面,政企用户对于数据安全、信息安全又格外敏感,随着《数据安全法》的实施,政企用户的上云和用云必然会对于云的安全能力提出更高挑战。
种种因素叠加,驱动着云服务商加速向全栈技术能力转型,也彻底改变了市场竞争的逻辑。
对于云服务商而言,芯片正在变得前所未有的重要。
今年 5月,亚马逊云科技由第三代自研芯片Amazon Graviton3支持的Amazon EC2 C7g实例正式可用;7月,谷歌云发布基于ARM的Tau T2A计算实例,自此Top级云服务商全都有了ARM云服务……云服务商们上半年在芯片方面有着密集的动作。
云服务商发力芯片领域的背后,有着两个极为重要的趋势:
其一、数据中心的算力范式正在发生明显变化。以X86为代表的传统通用处理器近年来处理能力提升一直不太明显,芯片频率提升在减慢,并且还需要兼容传统工作负载,芯片越做越大、越来越复杂,增加功能的同时也带来了工作负载不平衡、性能容易受影响以及安全隐患等问题。
因此,基于ARM的多核、并行处理计算成为下一代算力范式,有芯片设计能力的云服务商纷纷瞄准ARM。如今,全球Top 5的云服务全都推出了基于ARM的计算实例,国内像中国电子云等也都较早布局ARM处理器。
其二,云、边、端共存与协作成为云服务商业务场景的重点方向,使得异构计算兴起,通用计算芯片、AI芯片、可定义计算芯片等共存将成为一种新常态。
事实上,从性能角度来看,云服务商需要加大芯片研发投入,来持续打造极致性能,来支撑各类业务场景的需求;而从成本角度,芯片担当各种计算任务的重任,对于整个云服务商数据中心的能耗、效率、性能、运维等都有着重要影响,掌控芯片对于降低成本、节能减排也至关重要。
但是,云服务商投入到自研芯片的研发中绝非易事。众所周知,芯片作为三大根技术之一,其从设计到应用跟多种技术息息相关。以ARM处理器为例,其多核并行的设计,还与多核操作系统、多核应用程序以及微服务等紧密相关,要想真正发挥芯片的潜力,则需要云服务商具备全栈的优化能力、持续投入以及强大的生态能力。
亚马逊云科技是自研芯片的典型代表,其基于ARM架构的Graviton已经打造了三代,基于Graviton的计算实例服务极为丰富,并且还拥有AI训练芯片Trainium等。中国电子云则是国内云服务商的代表,基于中国电子PKS技术体系打造的PKS原生云,整合与优化飞腾处理器、麒麟操作系统、云安全等众多产品,无论是从技术、产品还是场景实践均处于业界领先。
可以预见,依靠强大的规模效应,云服务商未来有望对芯片的设计、产品和应用带来更多变化。
DPU最近两年很火,今年尤其火。
自2017年亚马逊云科技正式发布Nitro、阿里云宣布类似功能的神龙架构起,DPU概念日渐兴起。截止到今年上半年,英伟达、Intel、AMD、Marvell等传统芯片厂商全部加入DPU战局;另一方面,过去一年里,亚马逊云科技的Nitro、阿里云的神龙架构、中国电子云的雨燕架构均得以发布,充分说明作为DPU的头号实践者,云服务商对于自研DPU产品异常重视。
为何小小的DPU能够改变数据中心基础架构的发展方向?
这得从数据中心技术变化趋势谈起。在虚拟化和微服务等技术日渐普及的趋势下,数据中心处理器需要处理的任务量级也呈现出指数级的增长。业界有统计数据显示,在每年出货的大约3000万台服务器中,有三分之一的处理器算力用来运行数据中心的软件定义网络堆栈。用昂贵的通用计算处理器来做协议处理的工作,既没有做到物尽其用,又大幅提升了数据中心功耗、成本等,可谓是得不偿失。
因此,将网络协议甚至虚拟化卸载到专用硬件DPU上进行处理,不仅能够释放出CPU的宝贵性能,更可以大幅提升数据中心性能,实现数据中心性能、规模和功耗的平衡。
当前DPU发展有两个重要的趋势。第一个是开源开放的ARM给DPU产品、方案创新带来了前所未有的活力,目前市场中多个DPU方案均是采用了ARM处理器核心,例如Mavell的Octeon10、Broadcom的Stingray、中国电子云的雨燕架构等。
第二个趋势是领先的云服务商们纷纷投入到自研DPU之中,以此推动数据中心基础架构的变革。谁的虚拟机和微服务最多?毫无疑问就是云服务商。在互联网的电商大促、视频直播、政务领域的抗疫等场景中,涉及到AI深度学习、大数据、数据库等大规模海量应用时,往往会因为大规模集群网络互联带来的网络通信延迟,这是云服务商们所不能承受的。
面对动辄上百万台虚拟机、数十亿个微服务的业务量,云服务商们必须通过DPU来实现极致性能,推动数据中心迈向以数据处理为中心的架构。
以亚马逊云科技为例,Nitro架构发展到第四代,随之配套的服务器、计算实例等也日渐丰富。中国电子云也是典型代表,中国电子云基于雨燕架构打造了多款产品;例如,首款基于飞腾国产化芯片的DPU,是国内第一个基于PKS原生的纯国产化DPU产品;此外,基于雨燕架构,中国电子云还推出了基于飞腾S2500处理器的云原生服务器,实现了根据应用场景高度灵活的支持可拆可合的先进架构等。
毫无疑问,DPU能否持续获得成功,关键还是看用户需求。DPU源于云服务商,未来也会持续成为云服务商在数据中心基础架构领域的一大角力点,更会是云服务商基础架构与产品创新的催化剂,推动差异化云服务的构建与比拼。
今年初,《“十四五”数字经济发展规划》报告提出,实施“上云用云”行动,促进数字技术和实体经济深度融合,赋能传统产业转型升级。截止目前,全国共有超过20个城市将云计算作为重点发展产业,加速政企上云进程。在政策、趋势等因素的驱动下,政企已经成为上云的新主力军。与互联网行业不同,政企用户带来了截然不同的上云需求,开启了上云与用户需求的新阶段。
与此同时,随着5G、AI、大数据等技术的普及,智慧交通、智能制造、智慧港口、平安城市等诞生了大量的新应用、新场景,并且这些应用场景往往具有云、边、端协同的特征,这使得云计算加速向各种业务场景延伸,并且在产品、部署方式和生态方面走向多样化。
首先是产品形态的多样化,云服务商除了传统的计算、存储网络等云服务之外,像大数据、数据库、AI等云服务也是必不可少。此外,除了传统的公有云产品/服务之外,云服务商也在积极推出更加契合用户需求和实际环境的产品。例如,亚马逊云科技Outposts可以租赁给用户,中国电子云的超融合CeaCube等均可以部署在用户自身的数据中心环境。
第二则是部署方式走向多样化。过去,由于互联网用户是上云的主力军,所以云服务商更多强调了公有云的部署方式;现在,几乎所有云服务商都在强调部署方式的多样化,公有云Region、私有云、混合云、专属云、边缘云等多种部署方式可以满足政企用户的多样化需求。
例如,在燃气发电行业,电厂燃气轮机的智能运维就属于典型的云、边协同场景,需要云的多样化部署能力:既需要端侧不断采集设备的热力、温度、压力脉动等实时数据,对设备进行全面与实时监控,又需要边缘侧运行各种算法和模型,确保电厂侧各种运维决策的执行,还需要云端并不断训练和迭代各种算法与模型,将模型下发边缘侧,实现云边协同。为此,华电电科院与中国电子云联手打造的国内首个行业机燃机智慧运维平台,在华电集团20多家电厂60余台机组得到应用,为电力企业的数字化和智能化转型打造了一个极好的范例。
第三则是技术生态走向多样化:政企上云带来了极其复杂的需求,使得云服务商普遍在加快技术生态的多样化,在夯实底层IaaS的基础上,开放更多能力和接口,对接好各种数据库、大数据、SaaS应用,满足政企用户的多样化需求。
例如,出于对数据安全与合规的考虑,政企上云对于国产技术/产品有着强需求,这也带动了本土云服务商对于国产技术生态支持。比如,华为云的鲲鹏、昇腾技术生态;中国电子云则有PKS技术体系生态,囊括了中国电子旗下飞腾、麒麟、达梦、奇安信等广泛的生态伙伴,可以为政企用户提供完善的国产化技术方案与服务。
绿色节能正在成为云服务商未来多年的大考。
众所周知,近年来数据中心加速走向集约化、规模化,背后的推手就是云服务商、互联网公司这些超大规模数据中心用户。第三方数据显示,数据中心数量从2019年42.9万个降低到2021年的41.5万个,而超大规模数据中心则从2019年的512个增长到2021年691个。
与此同时,随着大量AI高功耗芯片的使用,数据中心的功率密度不断提升,带来了数据中心能耗的持续上升。仅2020年数据中心平均机架功率就达到了8.5kW/机柜,年复合增长率超过15%。预计到2030年,中国数据中心总耗电量将达到5915亿千瓦时,占全社会用电量的5%,数据中心已经成为名副其实的“能耗大户”。
今年初,随着全国一体化大数据中心完成总体设计布局,东数西算工程正式全面启动,要求新建数据中心PUE值必须低于1.3,并且PUE值超过1.5的老旧数据中心需要逐步完成绿色节能改造。因此,作为超大规模数据中心用户,云服务商的数据中心节能减排已经迫在眉睫。
事实上,对于云服务商而言,打造绿色、节能、高效的数据中心,既能够有效降低能耗成本,有利于提供更加高效的服务;又能承担起可持续发展、绿色节能的社会责任。以中国电子云的顺义信创云基地为例,其数据中心按照国标A级增强级、国际最高的T4级设计,采用自然冷却、热回收、光伏并网系统等技术实现绿色环保节能技术,将全年PUE控制在1.3以下,达到业内一流水平。
面向未来,数据中心规模化、集约化的趋势明显,云服务商必然会加大对于数据中心先进布局、清洁能源的使用和制冷技术的创新等方面的布局,加速推动绿色数据中心的建设,为整个社会的节能减排带来长期价值。
总体来看,随着中国数字经济体量成为全球第二,云计算已经成为支撑数字经济发展的基石。尤其是在政企上云的大趋势下,中国云计算市场将加速开启下一个发展周期。可以说,云计算的下半场才刚刚开始,这将是从技术、产品到服务、商业模式的全方位比拼。未来谁主沉浮尚未知,让我们拭目以待!