天极大咖秀

登录 | 申请注册

智算中心风云再起,如何锚定突围之路?

智能进化论 2024-07-05 阅读: 2,094 次

导读:2024年,智算中心建设全面提速,头部玩家争相布局。如何打造智算中心的差异化竞争能力?

2024年,随着大模型和生成式AI应用加速落地,各行各业对AI算力的需求持续暴涨。作为AI+时代的算力基础设施,我国的智算中心建设也步入提质加速的黄金发展期。

近年来,加速算力基础设施的政策频出,为算力产业发展绘制蓝图。2023年10月,工信部等六部门印发的《算力基础设施高质量发展行动计划》提出,到 2025 年全国算力规模超过300 EFLOPS,智能算力占比达到 35%。2024年《政府工作报告》提出适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。

市场层面,2023 年以来,国家及地方层面积极推进智算中心建设,北京、广东等地提出2025 年智算算力建设目标,杭州、南京、青岛、郑州等多地规划发放算力券,支持算力资源使用。地方政府与头部企业纷纷加大对智算中心投入,智算中心站上算力产业C位

智算中心提质加速 头部玩家跑马圈地

提质加速是当前智算中心建设的典型特征,智算中心建设明显提速,算力规模也大幅提升。2023 年下半年以来,全国多个1000P以上算力规模的智算中心完成签约或投入使用。

在这一轮智算中心建设热潮中,电信运营商、ICT厂商、服务器厂商等构成了头部玩家阵营,其中各厂商的发展路径及战略侧重有所不同。

  • 中国移动

2024年,三大电信运营商纷纷加大算力相关资本开支。比如中国移动2024年算力计划资本开支475亿元,同比增长21.5%。

今年4月,中国移动一口气在京津冀、长三角、粤港澳大湾区等区域投产首批12个智算中心节点,基本覆盖“东数西算”枢纽节点。其中,中国移动智算中心(呼和浩特)节点,是我国规模最大单体智算中心,投产后可提供6.7EFLOPS(FP16)的智能算力。中国移动的智算中心布局采用“N+X”体系,N指全国性和区域性智算中心,X指边缘性智算节点。

  • 华为

2024年6月,随着芜湖数据中心开服,华为云完成了贵安、乌兰察布、芜湖三大数据中心布局。在智算中心领域,华为基于昇腾计算产业,强调AI Native DC,以及云-网-边-端协同等优势。

同时,华为通过众多自研技术打出全栈系统性创新的口号,比如通过下一代云基础设施CloudMatrix、多元算力对等池化架构等技术创新,打造从单体算力到矩阵算力的跨越。

  • 浪潮信息

目前,浪潮信息在国内服务器、AI服务器领域都占据领先地位。浪潮围绕 “四化”趋势展开智算中心布局:算力基建化、算法基建化、服务智件化、设施绿色化,并提出“高质量算力”的理念。

浪潮强调以系统设计为核心,围绕算力的生产、聚合、调度、释放,实现更高的算力效率。此外,浪潮还通过牵头行业技术标准、繁荣元脑生态加速智算中心布局。

  • 宁畅

2024年,专注服务器领域15年的宁畅提出“全局智算”战略,强调从硬件、软件、算法、液冷和服务质量等多个维度应对企业对智算的复杂需求。

在该战略下,宁畅推出“AI算力栈”,以系统化方案构建全栈AI环境,帮助企业以更低成本、更具性价比的方式使用算力及服务。在液冷方面,宁畅在业内首先实现了“全栈全液”的智算中心建设能力。

  • 新华三

作为网络通信起家的综合性ICT厂商,新华三将“算力×联接”作为布局智算中心的核心优势,强调多元化算力和标准化联接的深度融合。基于“云-网-安-算-存-端”广泛布局的优势,新华三将数据、调度、算力、存储、绿色作为在AI基础设施领域的五大发力点。

聚焦差异化优势 成智算中心突围路径

当前,智算中心建设呈现一些共性趋势,比如强调大算力规模、基础设施层面的开放兼容、多元算力的融合、通过引入液冷实现绿色低碳等。

然而,仅做到这些很难从当前智算中心的同质化竞争中突出重围。通过头部玩家的战略布局可以看出,领先者往往聚焦对差异化竞争能力的打造:

  • 软硬件全栈优化能力

智算中心比拼的绝非算力性能单一维度,更需要软硬件全局优化能力,涵盖多元算力调度、算法协同优化、数据处理能力、以及与特定行业应用的融合度等等。

例如,新华三携手中国移动联合推出全调度以太网原型机(GSE),为智算中心量身打造新型智算网络。

宁畅以AI软硬件全栈优化能力,提供并行加速、性能分析、模型开发优化等服务,构建从算力资源定制,到模型适配优化,再到高效部署落地的大模型算力服务闭环

浪潮通过面向大模型训练定制优化的AI集群系统、算力集群调度软件、优化模型算法,实现千卡集群平均计算峰值效率高达 54%。

  • 按需定制化服务能力

千行百业以及企业不同发展阶段对AI算力的需求千差万别,智算中心时代企业同样需要精细化定制能力。

例如,华为通过瑶光智慧云脑可将多种池化资源统一调度管理,实现灵活按需组合,提供百亿到万亿参数模型的最优算力配比。

通过升级400G端口、纳入算力因子的路由算法等,新华三打造了适配算力应用的“算力高速公路”;同时推出服务化算力专线,针对突发大流量算力需求提供弹性、差异化的算力传送服务。

宁畅将定制化服务从服务器延续到智算中心领域,可以按企业发展阶段,定制专业的AI算力方案。在宁畅位于浙江桐乡的AI算力栈NEX AI Lab,企业还可通过免费试用,找到更具性价比的智算中心产品与服务。

  • 全液冷能力

当前,国家对数据中心、智算中心能耗的要求更加多维、更加严苛,相继推出PUE、WUE、CUE等能耗指标。虽然基于成本等因素,风液混合仍是当前智算中心的主流选择,但全面液冷是智算中心的大势所趋,也是各头部厂商重点布局的领域。

例如,浪潮提出“All in 液冷”战略以及风液同价的目标,并建成具备30万节点交付能力的“天池”液冷产业基地。

宁畅近期推出业内首个实现原生全液冷的通用机架服务器,从原生全液冷、大解耦、高能效三方面,加速智算中心向更高效能、更低能耗演进。

新华三的全栈液冷方案目前已覆盖冷板式和浸没式两大技术路线,其相变式浸没方案结合优秀的冷凝回流设计,可实现70%的散热效率提升。

随着智算中心建设规模的快速攀升,智算中心作为AI+时代新基建的地位将进一步强化。更重要的是,智算中心正在由大建快上的粗放扩张阶段走向深耕细作的精细化发展阶段。

如果说算力规模、广泛覆盖是粗放扩张阶段的特征,那么,更高的算力利用效率、更具性价比的算力方案、全栈全液、针对千行百业的精细化定制化服务,以及全生命周期运营能力等差异化优势,将成为接下来智算中心领域竞争的核心要素,也将成为算力产业快速健康发展的关键。

企业通过“全栈全液”基础设施方案,充分发挥液冷技术在能耗方面的突出优势,让智算中心更加绿色节能;与此同时,让企业在搭建智算中心过程中,通过“先试后买”找到更具性价比的算力方案,降低试错成本,提升算力利用率,或将成为未来智算中心可持续发展的一大趋势。

END

本文为「智能进化论」原创作品。

智能进化论
专注云计算、AI、数字化转型领域深度报道。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)