大模型下半场的比拼，为什么胜出的是联想？

“大模型已经进入下半场。”在前不久的联想创新科技大会（Lenovo Tech World 2025）上，中国信通院云计算与大数据研究所所长何宝宏做出了如此论断。

转场的关键时间点是2024年12月。从那以后，深度求索（DeepSeek）接连发布了DeepSeek-V3基座大模型、DeepSeek-R1推理模型、Janus-Pro多模态大模型，达到了OpenAI同类型模型的同等水平，训练成本却只有5%，运行成本更是只有3%。

如果说大模型的上半场是卷算力的狂飙突进的话，下半场则转入了效率为先的精耕细作。由于外部环境的变化，这种风格的切换，在中国市场尤甚。而这，当然也给中国的AI基础设施供应商带来了全新的挑战。

新的赛场、新的规则、新的范式，谁能抓住新的机会？

最好的时代
正如何宝宏所言，大模型的下半场，最大的变化就是在上半场已经发扬光大的、追求“高性能”的高端赛道之外，又出现了一条追求“高性价比”的普惠赛道。

由于普惠赛道的出现，使得AI基础设施市场出现了“杰文斯悖论”：当技术进步提升资源利用效率后，资源消耗量非但未减少，反而进一步增长。

这是最好的时代。IDC数据显示，2024年全球人工智能服务器市场规模预计为1251亿美元，2025年将增至1587亿美元，2028年有望达到2227亿美元，其中生成式人工智能服务器占比将从2025年的29.6%提升至2028年的37.7%。

中国市场的情况还要更为乐观。同样是根据IDC的预测，2023-2028年期间，中国智能算力规模的五年年复合增长率预计达到46.2%，通用算力规模预计达到18.8%。较上一版本的预期值33.9%和16.6%，均有显著提升。

最坏的时代
这也是最坏的时代。如今，由于大模型应用客户需求的巨大变化，也给所有的中国AI基础设施供应商提出了新的要求，他们必须尽快适应巨变并做到“四化”：

1.多元化：由于人工智能在国内的应用场景较为复杂，同时受到地缘、供应链等因素影响，人工智能芯片类型与厂商呈现出多元化的趋势，GPU、CPU、DSA、ASIC等多种芯片被广泛应用在人工智能的训练与推理中，不少场景实现了多类型芯片的混合使用。在芯片厂商方面，诸多国内厂商开始崭露头角，提供了大规模的算力集群方案。

2.服务化：为满足不同的算力需求，人工智能算力服务不断革新。生成式人工智能IaaS服务可为企业按需提供容量，支持灵活的模型训练和内容生成；算力租赁使用户按需租赁计算资源，降低成本并提高灵活性；算力共享通过资源池化和动态调度，实现资源共享和成本分摊；智算中心集成高性能的计算、存储和网络资源，提供高可用的一站式服务，支持大规模人工智能应用。

3.场景化：人工智能算力基础设施的多样化，旨在应对不同行业和应用场景的多样化需求。例如，金融行业需要高安全性和低延迟的计算环境，医疗行业需要处理大量医学影像数据，制造业需要实现实时生产优化，互联网行业需要处理大规模用户数据和内容推荐。这些需求对底层架构提出了高性能、低延迟、高安全性、可扩展性和成本效益等新要求。

4.绿色化：在双碳目标的指引下，全国范围内对绿色发展的重视程度和投资力度不断加大。政策上来说，一方面国家对于数据中心的新建审批及能耗要求上持续趋严；另一方面也会通过诸如电费分段计价等引导数据中心绿色化发展。

这样的新时代，中国的AI基础设施供应商该如何应对？

“四策”对“四化”
针对AI基础设施的“四化”，中国的AI基础设施供应商们同样也在行动起来，以“四策”来应对。

1.支持异构计算。如今在全球，异构计算大行其道；在中国市场，这个趋势则更加明显。IDC预测，到2029年中国加速服务器市场规模将超过千亿美元，其中非GPU服务器市场规模将接近50%。即使是在超过市场规模一半的GPU服务器市场，由于中国特有的环境，NVIDIA不再一枝独秀，而是出现了天数智芯、沐曦、摩尔线程、华为、燧原科技、壁仞科技、海光信息、寒武纪等诸多国产芯片厂商。对于中国AI基础设施供应商来说，关键就是要做好这些芯片厂商的适配。

2.算存网齐头并进。对于如今的AI基础设施提供商来说，计算、存储、网络能力必须同时提升。他们必须采用先进的计算架构，提升单计算节点性能，提高计算效率；还需要优化内存层次结构，减少数据传输延迟，增强数据处理速度；还得利用智能调度算法合理分配计算任务，优化集群管理方面，确保资源高效利用。面对智算客户的时候，他们还需要交付算存网一站式解决方案。

3.打造场景化产品。当然，AI基础设施提供商更需要针对大模型的各种应用场景，打造针对性的产品。例如，针对目前高速增长的推理场景，推出更适合推理的AI服务器；针对国内客户希望尽快用上满血版DeepSeek大模型并进行本地化部署的场景，发布DeepSeek一体机产品。

4.普及绿色技术。为了尽快实现双碳目标，业界积极探索破局之道。其中，液冷技术作为关键突破，可以显著提升计算密度，降低数据中心的总能耗。通过全栈液冷方案，将推动算力设施在计算节点层面、机柜层面以及数据中心层面的绿色化和低碳化转型。

六大创新技术
从联想创新科技大会上，我们已经看到，联想已经为下半场做好了充足的准备。

面对AI技术的持续创新和用户需求的快速变化，联想从算力性能与效能、核心算法、算力服务等多个维度再次发布六大创新技术：

1.AI推理加速算法集。针对大模型引发的推理需求爆发，AI推理加速算法集结合了MLA-多头潜在注意力机制、投机推理等业界新兴方法，以及联想长期优化的混合精度量化、分布式并行等算法，为推理加速打造强大的工具箱，助力用户突破推理性能极限，实现AI推理性能提升5-10倍。同时，相对于业界最优的社区方案，联想的AI推理性能保持20%以上的优势。

2.AI编译优化器。针对各个行业对大模型后训练与推理结合的前沿需求，AI编译优化器在训练或推理过程中能够自动化替换高效算子、优化计算路径，并进行自动重编译，大幅简化复杂的AI计算过程，在提升AI训推效率的同时，还实现了降低训练和推理计算开销各15%以上。

3.AI训推慢节点故障预测与自愈系统。面对大规模AI计算集群的运维需求，该系统通过对集群异步实时状态监测与全面故障分析，以AI预测AI故障，在节点性能下降前发现问题，并自动化解决故障，实现故障自愈时间控制在百卡秒级、千卡分钟级、万卡十分钟级。

4.专家并行通信算法。面向AI计算集群不断提升的网络能力需求，该算法通过对通信计算原语、访存方式和网络路由算法的协同优化，实现了推理延时降低3倍以上，网络带宽利用率从50%提升至90%。

5.“飞鱼”仿生散热设计与浸没式制冷系统。在液冷领域，该系统成功突破了散热器性能瓶颈，最大支持功耗提升20%；同时，联想还发布了“双循环”相变浸没制冷系统，通过创新的外接单相换热器设计，实现散热能力较传统方案翻倍提升，系统PUE低至1.035。

6.算力服务“成本-效能”双优运营系统。该系统从服务服务方面帮助提升用户运营效能，优化运营成本。

在支持异构计算方面，联想也做得足够深入。“DeepSeek大模型也好，通义千问3也好，它们的满血版在一些国产GPU上都已经跑通了，不仅仅是跑通，还做了调优。”联想中国基础设施业务部战略管理部总监黄山透露，联想与8大国产GPU厂商开展了广泛的合作，甚至深入到了算子级别。

联想中国基础设施业务部战略管理部总监黄山

两大重磅升级
除了发布六大创新技术之外，联想还宣布了两大重磅升级：

第一大重磅升级是发布了联想万全异构智算平台3.0版本，新增了AI推理加速算法集、AI编译优化器、AI训推慢节点故障与自愈系统、专家并行通信算法等四大突破性创新技术，直击大模型应用落地的关键痛点，从而为DeepSeek R1/V3等千亿级大模型提供更高效的运行环境，并不断突破算力效率极限。

在该平台的加持下，实测单机部署DeepSeek 671B模型吞吐突破12000 tokens/s，在极限场景下更是创下37000+ tokens/s的行业新纪录，充分展示了联想万全异构智算平台的技术领先性。

第二大重磅升级，是联想AI基础设施从计算力、存储力到运载力的全线升级：

1.计算力。如今，随着AI应用进入百花齐放的后训练时代，联想提出打造“更强大、更稳定、更高效、更绿色”的算力基础设施，并针对业务数据到智能业务全过程的三个关键应用场景——数据处理、模型训练和推理应用分别进行优化，形成数据处理算力服务器、AI训练算力服务器、推理应用算力服务器三大家族。

在这次联想创新科技大会上，联想重磅推出基于英特尔®至强®6处理器的全新算力服务器家族，包括联想问天 WA7880a家族在内的AI训练算力服务器家族、联想ThinkSystem SC750 V4在内的数据处理算力服务器家族；联想问天 WA5480 G5、WR5220 G5、联想ThinkSystem SR650 V4、SR650a V4、SR630 V4在内的推理应用算力服务器家族。面向不同的AI应用场景，全新算力服务器家族进行了针对性优化，充分释放AI服务器的算力潜能。

2.存储力。联想最新发布了凌拓全新存储产品家族，以及具备本地自研、自有知识产权、自主可控三大特征的联想存储新品牌联想问天。联想凌拓从数据管理到存储架构均进行了全方位升级，包括联想问天DXN AI 存储解决方案、DXN2000系列、DXN 全闪系列，Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列、AIPod DeepSeek一体机在内的联想凌拓全新存储产品家族，满足AI存储时代各个行业的需求。

3.运载力。联想通过RoCE/IB多架构融合及低延迟优化技术，构建了覆盖多种规模AI算力集群的智能网络体系。其数据网络产品兼容多种主流AI网络架构。最新发布的高密度400G交换机联想问天NE8770-64QC专为AI场景深度优化。同步亮相的还包括两款战略级新品——面向下一代融合网络的多业务核心交换机联想问天NE7550G-8C，以及支持超大规模组网的新一代高性能核心交换机联想问天NE9770G-4C。

此外，在软件及超融合领域，联想还升级了AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本。联想AIO超融合解决方案已实现2000+企业级客户部署，累计支撑超20000个核心业务系统平稳运行。

从以上六大创新技术和两大重磅升级可以看出，在应对大模型下半场的“四策”（支持异构计算、算存网齐头并进、打造场景化产品、普及绿色技术）上，联想已经走在了行业的最前列。

成为领军者
新的时代，也意味着新的机会。联想集团副总裁、中国基础设施业务群总经理陈振宽表示：“在各种创新叠加下，算力已不再仅仅是AI落地的底座，相反，正作为新兴的技术引擎推动中国AI新时代的落地。”

联想集团副总裁、中国基础设施业务群总经理陈振宽

如今的联想，已经开始收获果实。众所周知，在AI基础设施当中，最主力的产品就是AI服务器。联想中国基础设施业务群服务器产品部总经理周韬透露，去年联想服务器在中国市场创造了180%的惊人增速。究其原因，就是在AI服务器市场获得了大丰收。“去年得益于AI的大发展，我们在互联网、电信运营商、制造业、智算中心等领域都有比较大的突破。”

联想中国基础设施业务群服务器产品部总经理周韬

就在前不久，联想发布了2024/2025财年年报。其中，基础设施方案业务集团（ISG）表现优异，营收同比暴涨了63%，并在下半财年成功扭亏为盈。

如今，六大创新技术、两大重磅升级的发布，将进一步夯实联想在AI基础设施领域的基础，并向着广为广阔的市场进发。周韬表示，在互联网这个最重要的细分市场，联想除了继续扩大在Tier1的市场份额之外，还要进军Tier2。

面向AI的新十年，联想已经开启创业5.0时代。联想集团董事长兼CEO杨元庆表示，超级智能体时代，联想将致力于助力合作伙伴率先拥抱AI，携手把握这波机遇，深挖并服务好客户的人工智能新需求，成为行业的领军者。

大模型下半场的比拼，为什么胜出的是联想？

特别声明：文章版权归原作者所有，文章内容为作者个人观点，不代表大咖秀专栏的立场，转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)