天极大咖秀

登录 | 申请注册

透视元脑“算力工厂”,创新AI时代智算中心建设新范式

郭涛 2025-01-17 阅读: 964 次
刚一步入位于山东济南的浪潮信息产业园区,远远就望见一栋新建的“平房”,其简洁的工业风外观与毗邻的厂房、建筑物相得益彰。但在这统一风格之外,笔者总感觉这座“平房”并不像其外表那样“简单”。究竟是哪里不同呢?

初见:不像集装箱的集装箱数据中心

浪潮信息的工作人员揭秘了,这就是在120天内、由119个预制化集装箱拼接而成的元脑“算力工厂”。目前,它已成为支撑浪潮信息智能化转型的新底座,承载着大规模服务器测试、大模型应用开发以及诸多智能化业务。

集装箱数据中心并不新奇,但我们通常所见的都是由一两个或几个集装箱组成的小型数据中心,无论从外观设计还是内部狭窄的空间,都能够一眼分辨出来。但是步入元脑“算力工厂”的内部,给人的感觉是宽敞明亮舒适,上有整齐的走线和管道,下有高架地板,与传统的建筑级数据中心并无差别。穿梭其间,监控室、机房、配电间、制冷区域等一应俱全,其内部构造与各功能区域的设置也与传统数据中心无二,而且由于是多个封闭模块组成,其静音效果甚至比传统的高等级数据中心更佳。

你能想象吗?总功耗10MW,PUE低至1.1以下,结构材料80%可循环利用,基本实现自动化、智能化运维,更关键的是,如此“庞然大物”竟然是由119个预制化集装箱严丝合缝地拼成,无惧风吹日晒、冰霜雨雪。“这样一个规模巨大、绿色环保、运维智能的智算中心,没有采用传统的数据中心土建方式,而是全部采用预制化、集装箱式的构建方式,在早期的规划设计阶段就遇到了很多棘手的难题。”浪潮信息服务器产品线副总经理李金波举例说,比如集装箱如何设计和生产制造,如何才能让两个集装箱在拼接时做到“天衣无缝”,如何在未来进行扩展时做到在第二层施工的同时不影响一层算力中心的正常运行等。

在这座采用预制化AIDC解决方案建成的元脑“算力工厂”里,到底隐藏着多少“黑科技”呢?

揭秘:预制化AIDC的“黑科技”

从云数据中心时代开始,我们就经常听到有企业用户这样抱怨:“数据中心建成之时,就已经落后了。”这是因为以前总是先建数据中心基础设施,然后再考虑算力的匹配与实际的业务需求。而传统数据中心的建设要经过设计、土建、机电安装、调试等多个阶段,规划及建设周期通常在3年以上。

“快”人一步,120天建成交付

进入数智化时代,算力技术的迭代速度更快,芯片每年都在更新,应用的变化更是压缩至数月甚至数周,传统的数据中心构建模式已经捉襟见肘。元脑“算力工厂”在基础设施层采用新一代预制化AIDC构建方式,为大规模及超大规模智算中心的建设开辟了新的路径,树立了新的标杆。

“传统数据中心的建设速度跟不上高速增长的AI算力需求。面对这一窘境,我们在算力工厂基础设施的建设上,采用了标准化、预制式、模块化的模式,算力需求的规划与算力工厂基础设施的建设几乎同步进行,完美契合。算力工厂建成交付,算力同步供应。可以预见,基于预制化AIDC的算力工厂模式将成为智算中心建设的主流。”李金波如是说。

从浪潮信息预制化AIDC解决方案来看,它采用预制集装箱模块化设计,以“搭积木”的方式进行建设,并与土建解耦,不受施工条件限制,所有机电设备在工厂预集成、预测试,预制装配率高达90%;且集成工作与现场土建工作并行,相比传统土建机房,工期可缩短80%左右

其实,预制化AIDC解决方案又怎一个“快”字了得,它还通过模块化设计实现了灵活扩容与资源的最大化利用。其每一个模块都经过严格的质量控制和性能测试,确保在拼接后能够形成一个稳定、高效的整体,确保数据中心的可靠性与可用性。同时,预制模块化叠箱体系还可根据业务需求,分期高效进行水平和竖向扩容,包括IT、电力、集成冷站、液冷冷源、办公、走廊、电梯、楼梯等在内的多种功能箱体,可根据不同场景及规模灵活组合,并按功率区段分区部署,实现风冷/液冷、AI/通用/高密度等多种形态灵活兼容,轻松匹配智算算力、通用算力、边缘算力等多种应用场景。

“绿”意盎然,PUE降至1.1以下

功耗问题始终是智算中心建设与应用的一个掣肘。在过去十年间,CPU的热设计功率(TDP)几乎翻了一番,GPU的热设计功耗也从2008年的不足200W激增至目前的1000W。只有坚定不移地实现数据中心的绿色高效与可持续发展,才能从容应对高功耗芯片、高密度服务器和单机柜功率密度带来的挑战。

高效节能的浪潮信息预制化AIDC解决方案,创新性地将液冷、光伏、储能、余热回收等多种绿色技术有机结合,提高了散热及能源利用效率。比如,采用冷板式液冷技术结合氟泵空调系统,可将PUE降低至1.1以下,并可同时降低碳排放25%。元脑“算力工厂”集成的冷站采用变频冷机,冬季和过渡季节采用自然冷却方式,15℃/21℃中温冷水制冷,整机能效比≥5.5,同时结合余热利用技术,在冬季可覆盖办公区供暖。

浪潮信息预制化AIDC解决方案充分考虑到了环保与可持续发展的需求,其采用的集装箱为预制化钢结构建筑,材料回收率超过80%,而且在施工现场无粉尘、噪音,减少了建筑垃圾,有效地践行了绿色环保理念。

概括而言,元脑“算力工厂”采用了创新的智算中心建设模式,基于预制化AIDC解决方案的算力底座具备快速交付、高效节能、灵活扩展等核心优势,再加上浪潮信息的AI基础设施管理平台、人工智能开发平台AIStation等在算力高效运营层面的保驾护航,让智算中心的建设与运营更省心也更省力。

未来:智算中心建设的主流选择

回顾数据中心的发展历程,从计算中心、信息中心、云中心再到今天的智算中心,随着应用的变化和技术的进步,数据中心的定位、功能乃至建设方式也都在不断演进。但是万变不离其宗,数据中心始终要为业务服务,今天如何快速跟上智能算力的发展需要就是核心目标。

当前,生成式AI需求的爆发式增长,对智算中心的建设和运营提出了更高的要求,归纳起来主要体现在两个方面:第一,实现算力规模化、预制化以及敏捷地上线供应;第二,从IT设备到整个智算中心的物理基础设施,全面践行绿色化,降低能耗和碳排放,实现可持续发展。

根据如上要求,快速交付、超高密度、绿色低碳的浪潮信息预制化AIDC解决方案,无疑是智算中心建设的理想模式,按照此模式打造的元脑“算力工厂”就是最好的例证。

元脑“算力工厂”承载了全球服务器压力测试、大模型开发应用、智能化转型等多种业务应用。作为国内首个预制化模式服务器测试中心,它通过包含产品通用测试及实际应用测试在内的40大类、2000多项测试项,能够对服务器的性能、兼容性、安全性、稳定性、适应性等进行全面测试,具备150万台/年的压测能力,充分满足服务器研发和生产的大规模测试需求;它还可以支持教科研、生命科学、气象、能源、金融、自动驾驶、互联网等众多行业的POC测试需求,已为350+海内外客户提供测试支持。

此外,元脑“算力工厂”已成为浪潮信息智能化转型的重要支点,承载着供应链大脑、智能工厂、大模型迭代开发、智能客服、智能编程助手等一系列智能化业务,进一步提升了浪潮信息的智能制造及智能管理水平。

“预制化是智算中心最适合的构建模式。”浪潮信息人工智能与高性能产品线副总经理张强解释说,“这是由不断增长的AI集群规模所决定的,也是IT设备升级换代的必然选择,更是数据中心走向全面液冷的趋势所推动的。”

浪潮信息通过AIO级、临建级和建筑级等多样化的预制化AIDC解决方案,能够满足不同场地、不同业务场景的智算中心建设需求。预制化的算力工厂不再只是传统土建数据中心的“补充”,而是可以独当一面,快速、灵活、高能效地满足AI的需求。从最初的单个箱体发展到几个箱体的堆叠,再到如今的集群式智算中心,在使用寿命、安全可靠性等方面,算力工厂与传统数据中心几乎没有差别,将成为AI时代智算中心建设的主流选择。

郭涛
以“云”为基,以“数”为魂,以“智”为道,新IT,新经济。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)