天极大咖秀

登录 | 申请注册

算效最高的智算中心上线,天府智算为AI产业带来哪些启示?

大数据在线 2024-07-15 阅读: 11,577 次

四川简阳,地处川中、控扼巴峡,自古乃成渝、川鄂之间的交通重镇,素有“天府雄州”之美誉。

步入数字经济时代,“天府雄州”得天独厚的地理位置再次彰显出巨大的战略价值。简阳市成为成渝算力枢纽的天府数据中心集群关键布局点,对今后支撑四川数字经济和成都AI产业高质量发展有着举足轻重的意义。

近日,位于简阳市的天府智算西南智算中心正式上线,标志着成渝算力枢纽完成阶段性建设。同时,天府智算西南智算中心一跃成为当前国内算力效率(MFU)最高的算力中心,不仅代表着智算中心未来建设方向,也为AI产业高质量发展注入新动能。

AI产业高质量发展离不开算效比

四川被誉为“天府之国”,拥有完备的产业体系和深厚的教育资源。2023年,四川的经济总量已经跃居全国第五。从过去向经济要体量,到现在体量与质量并举,四川已明确发展新质生产力和经济高质量发展的核心思路:即加快做优做强人工智能产业,利用AI等数字化技术全方位、深层次赋能传统产业。

以成都市为例,成都市近年来集聚起一批人工智能企业、科研机构和创新平台,初步形成基础层、技术层、应用层全产业链覆盖的发展格局。最新《成都市人工智能产业高质量发展三年行动计划(2024—2026年)》更提出,到2026年,成都人工智能核心产业规模达到1700亿元,带动相关产业规模达到1万亿元,建成全国人工智能产业发展高地。

可以预见,随着四川经济全面向高质量发展转型,以及人工智能产业的持续发展,未来将产生大量且持续的算力需求,高质量的AI算力更是不能缺位。能投天府云执行董事兼总经理任国斌直言,与四川地区经济体量和AI产业发展需求相比,数据中心等算力基础设施正处于一个追平补短的快速发展阶段。

能投天府云执行董事兼总经理 任国斌

此时,建设高水平的智算中心就成为大势所趋。除了智算中心规模之外,算力效率(MFU)的重要性也日趋突出,以平衡未来算力与需求之间的供需关系。事实上,天府智算西南智算中心的上线,无疑是成渝算力枢纽在高水平智算中心的一次成功实践。

众所周知,人工智能产业高质量的发展,离不开生成式AI应用的爆发与普及。而生成式AI则需要基于海量的自然语言或多模态数据集,对拥有巨大参数的AI大模型进行持续训练,往往需要千卡甚至万卡的AI集群来支撑,所需AI算力当量远胜过往应用。

因此,超大规模的AI集群的训练算力效率(MFU)将直接影响到模型训练时长、成本乃至效果,更对于生成式AI研发创新、AI产业高质量发展有着潜移默化般的影响。毫无疑问,天府智算西南算力中心为算力效率(MFU)的提升打了个样儿。

据悉,天府智算西南算力中心为提升算力效率(MFU),与浪潮信息AI团队紧密配合,对算力系统进行专业设计,对集群架构、高速互联、算力调度等方面全面优化,并结合浪潮信息源大模型的训练优化经验,对分布式训练策略进行针对性优化,通过合理设计张量并行、流水并行和数据并行,精准调整模型结构和训练过程的超参数,最终实现千亿参数规模AI大模型的训练算力效率(MFU)提升至80%,刷新业界AI大模型训练算力效率(MFU)新高。

除了在算力效率(MFU)方面出类拔萃之外,天府智算西南算力中心还在数据中心能效层面进行了大胆创新和突破,以42kW智算风冷算力仓为创新切入点,完美解决数据中心高密部署、高效散热和机房维护改造等一系列挑战。

智算风冷算力仓:迎接高密化趋势

高密化是所有智算中心未来发展的确定性趋势。

由于人工智能产业的快速发展,对于数据中心算力、散热、运维乃至建设模式都提出全新要求,使得数据中心不可避免的走向高密化。高密化对于数据中心有着两个关键性影响:其一、可以大规模部署高密机柜,实现单位面积算力产能的提升;其二、会直接推动数据中心能效比提升以及先进节能技术落地,以满足数据中心绿色低碳的要求。

以四川地区为例,大量的AI服务器在智算中心部署,使得单机柜功率与功耗不断攀升,数据中心需要解决固定空间内高密化部署的高效散热挑战;其次,四川省已经颁布数据中心PUE政策,集群起步区内新建数据中心PUE不高于1.25,传统数据中心节能技术不能满足需求;第三,数据中心的建设模式与机房等环境需要匹配智算中心和未来算力服务的建设需求。

为此,能投天府云与浪潮信息进行联合创新,成功研发出42kW智算风冷算力仓,并且在天府智算西南算力中心得到大规模部署。浪潮信息服务器产品线总经理赵帅介绍,“42kW智算风冷算力仓本质上就是超高密化的模块化数据中心。”

42kW智算风冷算力仓以AI算力为核心,是为AI服务器量身定制的支持高算力密度部署的新一代智算基础设施,集计算/存储/网络于一体,高效融合机柜、配电、UPS、空调、监控、消防等系统,基于标准化、去工程化、运行效率最优化、管理智能化等原则设计,具备快速交付-省时、高密部署-省地、高效节能-省电、安全智能-省心等核心优势。

当下,以天府智算西南算力中心为代表的智算中心,普遍需要快速应对人工智能产业对于算力的急迫需求。通过42kW智算风冷算力仓,数据中心只需预留场地、冷量和电力,一周即可完成部署,建设周期缩短70%。

42kW智算风冷算力仓的高密化部署将单机柜功率密度从3~7kW大幅提升到42kW,输出超高密度算力,实现单位面积算力产能的突破,减少建设用地60%。

难能可贵的是,42kW智算风冷算力仓通过风冷模式即实现了高效节能,融合中压到末端馈线的全功率简链路供电及高效UPS系统让电能损耗有效降低30%以上;冷热通道全密封+列间空调高温进水模式让制冷能效比提升10%以上,大幅降低PUE,相比传统风冷数据中心整体节能25%以上。

此外,42kW智算风冷算力仓还充分融合了AI能力,利用AI管理平台实现数据中心统一纳管,结合AI智能调优算法,实现数据中心级及服务器级双向故障预警,做到数据中心真正的AI化监控、管理、运维,安全可靠性提升30%。

“现在的智算中心,单纯依靠AI服务器已经远远不够,需要通过高水平的数据中心来综合支撑AI服务器的部署与应用。在天府智算西南算力中心,浪潮信息与能投天府云很好地分析了业务需求,在一期采用了42kW智算风冷算力仓解决方案,快速上线满足了当前AI产业的算力需求。”赵帅补充道。

为“智算中心”建设打个样儿

IDC《全球人工智能支出指南报告》预测,到2027年,中国AI投资规模有望达到381亿美元,在政策扶持和产业转型升级的驱动下,以智算中心为代表的先进基础设施在未来五年将成为市场投资的重要方向。

随着各地对于经济高质量和新质生产力发展的需求,建设高水平的智算中心将是未来整个社会、产业的共同目标。而天府智算西南智算中心从规划、设计到上线,无疑为智算中心未来的建设打了个样儿。

首先,天府智算西南算力中心做到规划先进、贴近需求,针对成都市AI产业高质量发展的算力需求,从先进的规划设计到快速上线,实现了规划与需求的高度契合。目前,天府智算西南算力中心已经为高校研究所、科技型企业提供算力服务,广泛支撑起大数据、深度学习、智能语音语义、生物医学等领域的需求。

其次,天府智算西南算力中心是产业合作与创新的典型。智算中心是数据中心在AI时代的一次重塑,涉及到算力、环境、建设模式等方方面面。浪潮信息与能投天府云紧密合作,共同打造出创新的42kW智算风冷算力仓解决方案,将AI大模型训练算效比提升到80%。

第三,未来有望对外输出、惠及产业。面对未来AI产业高质量发展的需求,42kW智算风冷算力仓解决方案不仅为天府智算西南算力中心带来实质性的突破,更有望为其他智算中心建设带来最佳借鉴方案和巨大的产业价值。

“42kW智算风冷算力仓在天府智算西南算力中心交付之后,实现了数据中心定制服务领域的重大突破,为四川人工智能产业发展提供强劲的动能。”赵帅最后表示道。

大数据在线
洞悉技术趋势,聚焦产业发展

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)