在一众人们耳熟能详的国际大厂商之中,华为云的表现可以用“鹤立鸡群”来形容——华为云不仅在报告中获评“领导者”,更是在战略&执行维度得分名列全球第一。在云原生领域,华为云的领导性、前瞻性以及强大的综合实力得到全面彰显。
此外,Gartner报告的数据显示,在过去几年中,全球容器管理市场年增长率超过20%,2023年整体市场规模达到20亿美元,未来仍将持续快速增长。而随着容器“飞入寻常百姓家”,企业云基础设施也在朝着泛在化、云原生化、智能化的方向不断演进。
云原生基础设施泛在化
容器管理面临新挑战
容器是一种轻量级的可执行包,没有外部依赖性,为应用程序或服务的运行提供了一个完整、灵活的环境。因此,在容器中部署微服务已经成为众多企业的首选,企业应用的容器化率正逐年攀升。
无论是企业数智化转型,还是企业“出海”加速全球化布局,云原生基础设施都是不可或缺的底座。云原生的泛在化为千行百业的用户提供了无处不在、触手可及的云原生服务,从金融服务到交通出行,从生产制造到互联网社交,云原生能力覆盖了越来越多不同的场景,让应用真正实现了“Build Once,Run Anywhere”。
Omdia Universe报告指出,在容器应用越来越普及的背景下,容器管理的挑战也与日俱增。尤其是在大型企业和互联网规模的应用程序中,可能拥有成千上万个容器,缺乏管理大规模容器环境的技能是困扰企业的核心问题所在。
具体来看,容器管理面临的挑战主要表现在以下几个方面:
混合环境管理难度升级:随着企业越来越多地采用多云与混合云策略,管理跨多个云服务提供商和内部部署环境的容器环境变得越来越复杂,而容器管理软件或平台往往引入了多种组件和技术,使得整个产品的复杂性呈指数级上升,因此企业需要能够统一管理和操作跨云和混合云环境的容器解决方案;
容器多集群管理捉襟见肘:随着企业采用多个Kubernetes集群来满足不同的业务需求,管理这些集群的生命周期和状态变得越来越棘手,Kubernetes多集群管理工具和流程需要支持跨不同环境的容器部署和操作策略;
GPU资源管理与调度日益复杂:随着AI等高性能应用场景的快速兴起,容器环境中资源的动态调度与快速交付“门槛”升高,虽然某些容器管理产品和方案已经提供了AI相关的功能和插件,但实际的商业用例现阶段还较少;
安全与监管存在风险:容器的广泛采用引发了更多潜在的安全风险,比如配置错误的权限分配、容器镜像漏洞,以及未经严格审查的第三方容器镜像等,而那些严格监管的行业,包括政府、金融等,对容器管理方案有特定的监管与数据合规性要求,比如要求容器管理方案与国产IT基础架构高度兼容等;
实际上,除了上述技术层面的挑战以外,云原生基础设施自身的成熟度、企业文化与相关技能的转变等也是容器管理演进与创新的影响因素。综上,企业迫切需要更加灵活、安全且易于管理的容器产品和服务。
这就要看云服务商们如何来破题了。
全面云原生化
容器服务从能用到好用易用
华为云在以容器为核心的云原生领域的探索由来已久,积累了丰富的经验和良好口碑。IDC发布的《中国软件定义计算软件市场跟踪,2023H2》报告显示,华为云在2023下半年中国容器软件市场的份额和增速都位列第一。这已是华为云连续四年登顶,其行业领先地位一目了然。
从云原生1.0到2.0,华为云不断加大在云原生领域的战略投入,做好转型基座和赋能者,通过算力Serverless全池化、云原生算力全网互联、应用使能算力等产品和技术上的创新,持续优化云原生基础设施,当好企业云原生化的领路人、奠基者和催化剂。
那么,华为云究竟是如何做到的呢?下面就让我们抽丝剥茧,一起寻找答案吧。
1.全域Serverless化,谁主沉浮?
今年“十一”黄金周,去哪儿网的机票和酒店预订量比去年有了大幅增长,其中热门城市景区门票的预订量较2019年增长了3倍,单日预订量峰值再创历史新高。
弹性上云、降本增效,更好地满足业务波峰波谷的需求,这就是去哪儿网选择容器所要达到的目标。基于华为云Serverless容器CCI提供的弹性上云方案,助力去哪儿“0改造”,完成IDC业务的技术架构升级。华为云云容器服务CCI就像是一个内置的开关,在节假日等高峰时段自动“开闸”扩容,帮助去哪儿拓展云上带宽、计算等资源,满足海量数据兼容、高速处理的需求;而日常,“开关”则自动关闭,在保证业务有序运营的同时,最大程度减少云资源浪费,从而大幅降低运营成本。
当前,我们已经迈入“全域Serverless时代”,Serverless成了云原生算力的主流形态。
华为云Serverless融合资源池基于华为自研云原生专属OS(Huawei Cloud Euler Container OS)构建,容器启动时间小于0.5s,内存开销不足156M,容器弹性速度达到4000 Pods/30s,领先整个业界。基于Serverless基础设施构架的华为云云原生Cloud Bursting解决方案,能够支持用户业务弹性上云,快速响应业务洪峰。
华为云提供的CCE Autopilot和CCI Serverless容器,具备极速弹性、极简体验、精益治理、安全可靠等特点。用户可以根据自己的实际需求,有针对性地选择最适合自己的产品:CCE Autopilot使用的是华为云统一Serverless融合资源池,用户在使用原生Kubernetes API的同时,无需关心节点的生命周期管理;CCI则是业界首个Serverless Container产品,用户无须感知Kubernetes集群,仅需关心工作负载的生命周期管理。
2.如何跨越Kubernetes管理的高门槛?
在成本更加敏感的AI时代,如何利用云计算、人工智能等技术实现资源利用率的最大化、降本增效是所有企业必须面对的挑战。小红书基于华为云CCE Turbo构建了融合资源池,对容器使用的资源进行统一调度,并通过精细化CPU核编排、GPU共享调度、拓扑感知调度、离线资源调度方法灵活应对资源需求潮汐,混部集群利用率最高可达60%,同时为离线节省了大量计算资源成本。
作为华为云高性能Kubernetes管理平台,CCE Turbo究竟“高”在哪里呢?它从计算、网络和调度三个维度全面提速,为容器的全面规模化应用奠定了坚实基础。
首先看计算加速,CCE Turbo独家实现了容器100%卸载,以及服务器资源和性能双零损耗;其次看网络加速,CCE Turbo采用独创的容器直通网络,将两层网络变成一层,使得端到端连通时间缩短一半,有效支撑业务秒级扩容千容器;最后看调度加速,CCE Turbo使用了云原生AI调度引擎Volcano,通过感知AI、大数据、Web业务的不同特征,以及应用模型、网络拓扑等,实现了业务混合部署、智能调度,还能自动优化任务调度策略。
3.如何避免被多云的复杂性束缚住手脚?
在金融、零售、高科技等行业中,多云环境已经成为常态。在多云环境中应用容器,跨云容器编排工具是关键,确保容器主机操作系统的一致性是根本,满足安全管理要求是基本原则,充分考虑容器的迁移和兼容性是必须。
华为云具备业界产品矩阵最丰富的多云、混合云和边缘计算产品,能够全面满足不同场景下的容器应用需求。
华为云分布式云原生服务UCS,基于华为云开源的多云编排引擎Karmada为内核进行构建,实现了跨集群管理和服务治理,可接入任意位置的Kubernetes集群,屏蔽集群的位置差异,以云原生的方式重构多云混合基础设施。UCS具备多集群调度、多集群弹性、多集群服务治理、多集群GitOps、多集群策略管理和多集群可观测性等能力,可支持多云、混合云、边缘计算等场景的容器集群统一管理。
在多云方面,基于UCS(Multi-Cloud)和UCS(Attached Clusters),可以将CCE集群部署到第三方IaaS基础设施之上,还可纳管AWS EKS、GCP GKE、Openshift等标准第三方云Kubernetes集群。在混合云方面,华为云提供全栈HCS(Huawei Cloud Stack)容器全系列服务,以及可运行于物理机之上的CCE敏捷版,能够满足企业数字化转型不同阶段的诉求。在边缘计算方面,基于华为云CloudPond软硬一体化智能边缘小站,可为企业边缘数据中心提供CCE Turbo等容器服务;华为云IEF服务适用于现场边缘场景,可支持最小128MB的边缘设备或工控机。
4.开源开放才有未来
在云计算、大数据、人工智能等诸多领域,许多开源软件已经十分成熟。开源通过提供成熟的解决方案和工具,可以帮助企业提高开发效率,快速构建和部署应用,促进技术的共享与协同创新。华为云是CNCF的长期贡献者,目前参与了68个CNCF项目的贡献,并且是2024年中国唯一获得CNCF TOC席位的云厂商。
华为云先后向CNCF捐赠了KubeEdge、Volcano、Karmada、Kuasar、kmesh等开源项目,帮助云原生生态拓展到众多行业领域。比如,KubeEdge至今已累计发布43+个特性版本,完成了业界最大规模云原生边云协同高速公路项目、首个云原生星地协同卫星、首个云原生车云协同汽车、业界首个云原生海上油田等项目。再比如,Karmada是CNCF唯一孵化级的多云多集群容器编排项目,已在很多企业中实现了大规模生产使用,为企业提供从单集群到多云架构的平滑演进方案。另外,像CNCF首个和唯一的云原生AI调度引擎Volcano、CNCF首个云原生多沙箱容器运行时项目Kuasar也都在行业中实现了广泛应用。
在容器领域,华为云将一直坚持开源开放、持续创新,牵引云原生走深入实。
智能化
充分释放云原生的价值
随着AIGC浪潮的到来,容器成了AI的最佳载体。Omdia在报告中指出,受生成式AI和大模型的驱动,越来越多的AI工作负载将利用云原生方法进行开发。
与时俱进的华为云乘着AI的东风,全面布局昇腾云容器、云原生AI调度引擎Volcano等。CCE Turbo就使用了Volcano,适用于AI、大数据、基因、渲染等众多高性能计算场景,支持Pytorch、TensorFlow、Spark、Flink、MPI、MindSpore等几乎所有业界主流计算框架,可加速云原生落地的进程。另外,华为云将多年的软件、调度能力与硬件结合,推出全新的下一代AI原生的云基础设施平台CloudMatrix,通过“一切可池化、一切皆对等、一切可组合”的颠覆性设计,在算力规模、扩展模式、使用模式上更加匹配AI时代超大规模算力的需求。
事实证明,Serverless AI、云原生训推一体、泛在AI计算等新范式,能够更好地支持AI大模型创新。华为云AI算力以CCE Turbo等服务为基础,已实现100%云原生化,同时结合多年的最佳实践和行业经验,能够为AI生态系统提供更坚实的底座支撑。
Omida预测,到2028年,全球容器服务的市场规模将达到140亿美元,是2024年的3.5倍。容器技术将有更大的用武之地。在Omdia的报告中,华为云是中国用户的首选,并且在战略及市场执行评估中表现出色。在AIGC时代,释放云原生的最大价值,是行业用户的期待,也是对华为云的新考验。