“大模型已经进入下半场。”在前不久的联想创新科技大会(Lenovo Tech World 2025)上,中国信通院云计算与大数据研究所所长何宝宏做出了如此论断。
转场的关键时间点是2024年12月。从那以后,深度求索(DeepSeek)接连发布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模态大模型,达到了OpenAI同类型模型的同等水平,训练成本却只有5%,运行成本更是只有3%。
如果说大模型的上半场是卷算力的狂飙突进的话,下半场则转入了效率为先的精耕细作。由于外部环境的变化,这种风格的切换,在中国市场尤甚。而这,当然也给中国的AI基础设施供应商带来了全新的挑战。
新的赛场、新的规则、新的范式,谁能抓住新的机会?
最好的时代
正如何宝宏所言,大模型的下半场,最大的变化就是在上半场已经发扬光大的、追求“高性能”的高端赛道之外,又出现了一条追求“高性价比”的普惠赛道。
由于普惠赛道的出现,使得AI基础设施市场出现了“杰文斯悖论”:当技术进步提升资源利用效率后,资源消耗量非但未减少,反而进一步增长。
这是最好的时代。IDC数据显示,2024年全球人工智能服务器市场规模预计为1251亿美元,2025年将增至1587亿美元,2028年有望达到2227亿美元,其中生成式人工智能服务器占比将从2025年的29.6%提升至2028年的37.7%。
中国市场的情况还要更为乐观。同样是根据IDC的预测,2023-2028年期间,中国智能算力规模的五年年复合增长率预计达到46.2%,通用算力规模预计达到18.8%。较上一版本的预期值33.9%和16.6%,均有显著提升。
最坏的时代
这也是最坏的时代。如今,由于大模型应用客户需求的巨大变化,也给所有的中国AI基础设施供应商提出了新的要求,他们必须尽快适应巨变并做到“四化”:
1.多元化:由于人工智能在国内的应用场景较为复杂,同时受到地缘、供应链等因素影响,人工智能芯片类型与厂商呈现出多元化的趋势,GPU、CPU、DSA、ASIC等多种芯片被广泛应用在人工智能的训练与推理中,不少场景实现了多类型芯片的混合使用。在芯片厂商方面,诸多国内厂商开始崭露头角,提供了大规模的算力集群方案。
2.服务化:为满足不同的算力需求,人工智能算力服务不断革新。生成式人工智能IaaS服务可为企业按需提供容量,支持灵活的模型训练和内容生成;算力租赁使用户按需租赁计算资源,降低成本并提高灵活性;算力共享通过资源池化和动态调度,实现资源共享和成本分摊;智算中心集成高性能的计算、存储和网络资源,提供高可用的一站式服务,支持大规模人工智能应用。
3.场景化:人工智能算力基础设施的多样化,旨在应对不同行业和应用场景的多样化需求。例如,金融行业需要高安全性和低延迟的计算环境,医疗行业需要处理大量医学影像数据,制造业需要实现实时生产优化,互联网行业需要处理大规模用户数据和内容推荐。这些需求对底层架构提出了高性能、低延迟、高安全性、可扩展性和成本效益等新要求。
4.绿色化:在双碳目标的指引下,全国范围内对绿色发展的重视程度和投资力度不断加大。政策上来说,一方面国家对于数据中心的新建审批及能耗要求上持续趋严;另一方面也会通过诸如电费分段计价等引导数据中心绿色化发展。
这样的新时代,中国的AI基础设施供应商该如何应对?
“四策”对“四化”
针对AI基础设施的“四化”,中国的AI基础设施供应商们同样也在行动起来,以“四策”来应对。
1.支持异构计算。如今在全球,异构计算大行其道;在中国市场,这个趋势则更加明显。IDC预测,到2029年中国加速服务器市场规模将超过千亿美元,其中非GPU服务器市场规模将接近50%。即使是在超过市场规模一半的GPU服务器市场,由于中国特有的环境,NVIDIA不再一枝独秀,而是出现了天数智芯、沐曦、摩尔线程、华为、燧原科技、壁仞科技、海光信息、寒武纪等诸多国产芯片厂商。对于中国AI基础设施供应商来说,关键就是要做好这些芯片厂商的适配。
2.算存网齐头并进。对于如今的AI基础设施提供商来说,计算、存储、网络能力必须同时提升。他们必须采用先进的计算架构,提升单计算节点性能,提高计算效率;还需要优化内存层次结构,减少数据传输延迟,增强数据处理速度;还得利用智能调度算法合理分配计算任务,优化集群管理方面,确保资源高效利用。面对智算客户的时候,他们还需要交付算存网一站式解决方案。
3.打造场景化产品。当然,AI基础设施提供商更需要针对大模型的各种应用场景,打造针对性的产品。例如,针对目前高速增长的推理场景,推出更适合推理的AI服务器;针对国内客户希望尽快用上满血版DeepSeek大模型并进行本地化部署的场景,发布DeepSeek一体机产品。
4.普及绿色技术。为了尽快实现双碳目标,业界积极探索破局之道。其中,液冷技术作为关键突破,可以显著提升计算密度,降低数据中心的总能耗。通过全栈液冷方案,将推动算力设施在计算节点层面、机柜层面以及数据中心层面的绿色化和低碳化转型。
六大创新技术
从联想创新科技大会上,我们已经看到,联想已经为下半场做好了充足的准备。
面对AI技术的持续创新和用户需求的快速变化,联想从算力性能与效能、核心算法、算力服务等多个维度再次发布六大创新技术:
1.AI推理加速算法集。针对大模型引发的推理需求爆发,AI推理加速算法集结合了MLA-多头潜在注意力机制、投机推理等业界新兴方法,以及联想长期优化的混合精度量化、分布式并行等算法,为推理加速打造强大的工具箱,助力用户突破推理性能极限,实现AI推理性能提升5-10倍。同时,相对于业界最优的社区方案,联想的AI推理性能保持20%以上的优势。
2.AI编译优化器。针对各个行业对大模型后训练与推理结合的前沿需求,AI编译优化器在训练或推理过程中能够自动化替换高效算子、优化计算路径,并进行自动重编译,大幅简化复杂的AI计算过程,在提升AI训推效率的同时,还实现了降低训练和推理计算开销各15%以上。
3.AI训推慢节点故障预测与自愈系统。面对大规模AI计算集群的运维需求,该系统通过对集群异步实时状态监测与全面故障分析,以AI预测AI故障,在节点性能下降前发现问题,并自动化解决故障,实现故障自愈时间控制在百卡秒级、千卡分钟级、万卡十分钟级。
4.专家并行通信算法。面向AI计算集群不断提升的网络能力需求,该算法通过对通信计算原语、访存方式和网络路由算法的协同优化,实现了推理延时降低3倍以上,网络带宽利用率从50%提升至90%。
5.“飞鱼”仿生散热设计与浸没式制冷系统。在液冷领域,该系统成功突破了散热器性能瓶颈,最大支持功耗提升20%;同时,联想还发布了“双循环”相变浸没制冷系统,通过创新的外接单相换热器设计,实现散热能力较传统方案翻倍提升,系统PUE低至1.035。
6.算力服务“成本-效能”双优运营系统。该系统从服务服务方面帮助提升用户运营效能,优化运营成本。
在支持异构计算方面,联想也做得足够深入。“DeepSeek大模型也好,通义千问3也好,它们的满血版在一些国产GPU上都已经跑通了,不仅仅是跑通,还做了调优。”联想中国基础设施业务部战略管理部总监黄山透露,联想与8大国产GPU厂商开展了广泛的合作,甚至深入到了算子级别。
联想中国基础设施业务部战略管理部总监黄山
两大重磅升级
除了发布六大创新技术之外,联想还宣布了两大重磅升级:
第一大重磅升级是发布了联想万全异构智算平台3.0版本,新增了AI推理加速算法集、AI编译优化器、AI训推慢节点故障与自愈系统、专家并行通信算法等四大突破性创新技术,直击大模型应用落地的关键痛点,从而为DeepSeek R1/V3等千亿级大模型提供更高效的运行环境,并不断突破算力效率极限。
在该平台的加持下,实测单机部署DeepSeek 671B模型吞吐突破12000 tokens/s,在极限场景下更是创下37000+ tokens/s的行业新纪录,充分展示了联想万全异构智算平台的技术领先性。
第二大重磅升级,是联想AI基础设施从计算力、存储力到运载力的全线升级:
1.计算力。如今,随着AI应用进入百花齐放的后训练时代,联想提出打造“更强大、更稳定、更高效、更绿色”的算力基础设施,并针对业务数据到智能业务全过程的三个关键应用场景——数据处理、模型训练和推理应用分别进行优化,形成数据处理算力服务器、AI训练算力服务器、推理应用算力服务器三大家族。
在这次联想创新科技大会上,联想重磅推出基于英特尔®至强®6处理器的全新算力服务器家族,包括联想问天 WA7880a家族在内的AI训练算力服务器家族、联想ThinkSystem SC750 V4在内的数据处理算力服务器家族;联想问天 WA5480 G5、WR5220 G5、联想ThinkSystem SR650 V4、SR650a V4、SR630 V4在内的推理应用算力服务器家族。面向不同的AI应用场景,全新算力服务器家族进行了针对性优化,充分释放AI服务器的算力潜能。
2.存储力。联想最新发布了凌拓全新存储产品家族,以及具备本地自研、自有知识产权、自主可控三大特征的联想存储新品牌联想问天。联想凌拓从数据管理到存储架构均进行了全方位升级,包括联想问天DXN AI 存储解决方案、DXN2000系列、DXN 全闪系列,Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一体机在内的联想凌拓全新存储产品家族,满足AI存储时代各个行业的需求。
3.运载力。联想通过RoCE/IB多架构融合及低延迟优化技术,构建了覆盖多种规模AI算力集群的智能网络体系。其数据网络产品兼容多种主流AI网络架构。最新发布的高密度400G交换机联想问天NE8770-64QC专为AI场景深度优化。同步亮相的还包括两款战略级新品——面向下一代融合网络的多业务核心交换机联想问天NE7550G-8C,以及支持超大规模组网的新一代高性能核心交换机联想问天NE9770G-4C。
此外,在软件及超融合领域,联想还升级了AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本。联想AIO超融合解决方案已实现2000+企业级客户部署,累计支撑超20000个核心业务系统平稳运行。
从以上六大创新技术和两大重磅升级可以看出,在应对大模型下半场的“四策”(支持异构计算、算存网齐头并进、打造场景化产品、普及绿色技术)上,联想已经走在了行业的最前列。
成为领军者
新的时代,也意味着新的机会。联想集团副总裁、中国基础设施业务群总经理陈振宽表示:“在各种创新叠加下,算力已不再仅仅是AI落地的底座,相反,正作为新兴的技术引擎推动中国AI新时代的落地。”
联想集团副总裁、中国基础设施业务群总经理陈振宽
如今的联想,已经开始收获果实。众所周知,在AI基础设施当中,最主力的产品就是AI服务器。联想中国基础设施业务群服务器产品部总经理周韬透露,去年联想服务器在中国市场创造了180%的惊人增速。究其原因,就是在AI服务器市场获得了大丰收。“去年得益于AI的大发展,我们在互联网、电信运营商、制造业、智算中心等领域都有比较大的突破。”
联想中国基础设施业务群服务器产品部总经理周韬
就在前不久,联想发布了2024/2025财年年报。其中,基础设施方案业务集团(ISG)表现优异,营收同比暴涨了63%,并在下半财年成功扭亏为盈。
如今,六大创新技术、两大重磅升级的发布,将进一步夯实联想在AI基础设施领域的基础,并向着广为广阔的市场进发。周韬表示,在互联网这个最重要的细分市场,联想除了继续扩大在Tier1的市场份额之外,还要进军Tier2。
面向AI的新十年,联想已经开启创业5.0时代。联想集团董事长兼CEO杨元庆表示,超级智能体时代,联想将致力于助力合作伙伴率先拥抱AI,携手把握这波机遇,深挖并服务好客户的人工智能新需求,成为行业的领军者。