“AI时代，Tokens成为新的衡量标准，2024年年初，中国日均Token消耗量为1千亿，今天每日消耗量已达到了十万亿级，1年增长100倍。”华为昇腾计算业务总裁张迪煊，在昇腾人工智能伙伴峰会上这样说。

华为昇腾计算业务总裁张迪煊作《与时代共昇腾》演讲

庞大Token消耗量背后，反应的是当下中国正在进入一个“AI应用的黄金期”。不过，大模型落地并非一蹴而就的。再聪明的大模型也仅是“缸中之脑”，想要引发山呼海啸的AI变革浪潮，仍需要有人为其提供大量的配套支持。

种种迹象表明，2025年正在成为AI应用元年。但谁又在为千行万业智能化转型按下加速键呢？

将DeepSeek“搬”出实验室

DeepSeek绝对会在中国AI发展史上，留下浓墨重彩的一笔。其DeepSeek性能优越，被一些美国人称为“人工智能的斯普特尼克时刻”，认为它的威力不亚于冷战期间苏联发射首颗人造卫星“斯普特尼克1号”，对美国产生的冲击。

尽管DeepSeek“聪明绝顶”，但在发布之初其距离“人人使用”的“国民大模型”仍有较大距离。原因有二：

一是，DeepSeek的满血版模型（V3和R1）参数高达6710亿，单机部署需多块高性能GPU比如需要8卡并行才能部署，而国产AI芯片在多机互联技术尚未完全突破，导致满血版模型在端侧部署困难；

二是，DeepSeek专注于文本生成与推理，本身缺乏多模态能力，在医疗影像诊断、工业质检中适配性受限。

这些问题得不到解决，DeepSeek便只是个聪明一点的“Chat Bot”。中国企业则又会陷入“守着金山要饭吃”的尴尬窘境。但好在 “开源” 的优势为解决这些困境带来了转机。

在演讲中，我们看到了DeepSeek掀起的“春节攻势”背后的一系列昇腾行动：

在春节第一时间，昇腾和伙伴硅基流动共同作战，迅速面向全国用户第一时间提供DeepSeek的线上服务，解决了用户因本地部署困难而无法使用 DeepSeek 的燃眉之急；

春节后的2周，昇腾围绕融合算子、通信优化、并行加速、推理系统、强化学习五大方向实现工程技术创新，让一体机性能翻番，同时昇腾率先完整复现Open-R1后训练全流程，并将能力沉淀成套件和解决方案，开放给伙伴，让更多企业能够利用DeepSeek 开发出符合自身业务需求的创新应用；

春节后的一个月，已经有超过80个伙伴基于昇腾落地大模型应用一体机、国内25城人工智能计算中心都上线DeepSeek。150多家企业基于昇腾快速部署上线DeepSeek。

从实验室技术到应用成果遍地开花，昇腾只用了1个月的时间。

为什么是昇腾？

在笔者看来，这场行动透露出昇腾在推动AI加速落地上的三个“度”。

第一个“度”，是支撑的“速度”，围绕大模型的适配和性能释放，昇腾可谓是马不停蹄，争分夺秒地进行快速响应、技术创新以及生态协同，在支撑AI落地千行万业上成了引领者。

第二个“度”，是创新的“深度”，围绕AI落地所出现的新问题，昇腾进行深度、全面的技术创新，保驾护航。例如困扰很多企业部署类MoE大模型面临的算力成本高、并发能力弱、内存瓶颈显著等问题，昇腾推出了大规模专家并行解决方案。通过将MoE模型的多专家权重数据分散部署到更多的卡上，降低单卡权重加载时延，让模型解码输出更快；同时，单卡可提供更大内存容量支持更大用户并发所需的KV缓存，实现系统的更大吞吐性能，推理引擎支持从单卡加速到大规模专家并行集群的极致加速。这个方案的本质是通过全栈技术的协同优化，突破混合专家模型在大规模部署中的效率瓶颈，实现性能、成本和资源利用率的最优平衡。

第三个“度”，是场景的“广度”，在AI部署上，昇腾的创新是围绕企业客户的不同场景痛点进行创新，并助力伙伴抓住AI应用爆发的全场景。例如，围绕企业轻量化部署AI的需求，昇腾助力伙伴基于昇腾发布一体机，从模型部署、推理加速到应用上线，昇腾能为伙伴提供了业界领先的方案支持，量化、调优等工具链显著提升50%部署效率；围绕大吞吐、低时延等高要求业务场景，昇腾携手科大讯飞率先实现大规模专家并行集群推理解决方案；为了满足客户打造专属“行业R1”模型的需求，昇腾率先打通从微调、蒸馏到强化学习的全流程，将能力沉淀至MindSpeed-RL套件等等，都是这样。

“技术创新+生态开放”双轮驱动，与行业“共昇腾”

《与时代共昇腾》的演讲透露了更多昇腾的相关信息和最新进展。

在昇腾人工智能伙伴峰会上，昇腾发布业界首个强化学习开发套件MindSpeed RL，其通过全栈技术创新和开源生态支持，解决了传统强化学习在大模型应用中面临的核心难题，全流程的工具链支持助力开发者无需从零构建复杂流程，显著缩短开发周期，而算法与框架同源支持企业快速复现训练流程，甚至适配千亿级MoE模型的强化学习需求。同时，训推共卡技术、异步流水调度优化等技术创新，实现了大模型RL训练的“性能-效率-成本”平衡。

更重要的是，MindSpeed RL在Gitee上开源，其意义在于通过技术解耦与生态开放，让强化学习不再是高门槛的科研工具，而是变成一种标准化生产力工具。用张迪煊的话来说，就是“让每个企业都有机会打造属于自己的‘R1模型’。”

这透露出昇腾的清晰运作模式，那就是“技术创新+生态开放”的双轮驱动：一个轮子进行全栈的技术创新，不断围绕客户和时代需要，攻克技术难题；另一个轮子是将技术创新开放给生态伙伴，赋能伙伴打造更有竞争力的产品和解决方案。

在过去的一年时间里，昇腾坚定围绕硬件、算子、加速库、模型及应用五大创新方向，携手伙伴，共同发展。今年，昇腾将持续加大生态投入，从技术、政策、生态及激励几个维度持续为伙伴提供支撑。

在昇腾人工智能伙伴峰会上，张迪煊公布了昇腾在双轮驱动上的诸多新进展。

例如，硬件使能层CANN深度开放，从上层图引擎到底层运行时，从融合算子到通信算法，释放硬件极致性能，使能伙伴及客户自主创新。

例如，推理引擎MindIE持续升级，vLLM开源社区与昇腾的对接，让开发者可以基于昇腾使用vLLM全量功能，而MindIE Turbo推理加速插件，可以为vLLM提供高阶优化，吞吐可提升20%以上，实现极致性能。

例如，鹏城实验室基于昇思发布GRPO强化学习训练框架，率先突破了大模型强化学习全栈技术壁垒。昇思持续演进自然与万千开发者的贡献息息相关。

例如，刚刚发布的昇腾自动驾驶SDK，就聚合了昇腾在自动驾驶数据闭环、模型“天”级迭代上的技术创新模型性能提升30%以上，而套件的模型和算子全量开源在Gitee上，并提供丰富的参考设计，很好地体现出“技术创新+生态开放”这个双轮驱动，所带给伙伴和客户在智驾训练上的价值。

显然，这种双轮驱动，是AI发展和应用的最优解，昇腾可以聚焦在自己最擅长的产品和技术领域，而不同行业、不同阶段的伙伴可以将自身对行业的洞察和积累与昇腾的技术创新相结合，实现差异化优势，共同在AI时代弄潮。

这就是“与时代共昇腾”的真实含义。

后记：AI行业新范式

这段时间，笔者在行业做了很多采访，一个深刻的感受是进入2025年，AI正在呈现出发展的新范式。

新范式之一，是从“训练为主”到“训推结合”，推理时代正在到来，对推理算力以及性能和收益提出了新要求。张迪煊指出，每次长思考的逻辑推理，都会带来额外20倍的token生成，随之而来的是百倍的推理算力需求。

新范式之二，是技术平权，AI的行业落地门槛在大大降低。正如张迪煊所说，AI自主创新的序幕已经揭开，高质量模型+后训练范式大幅提升行业模型效果，降低了行业落地门槛，推动2025进入大模型应用元年。

新范式之三，是中国自主AI生态迎来难得的发展机遇。中国在大模型上与全球并驾齐驱，而开源特性也大幅降低了AI落地行业的门槛，进而推动越来越多的企业、高校、科研机构和开发者加入，人工智能产业在中国迸发出越来越旺盛的创新活力。

站在这些人工智能产业范式革命的角度，再来看昇腾在全栈技术创新与生态开放协同上的一系列举措，可以清晰地看到，昇腾所做的一切，都抓准了AI范式革命的脉搏，通过技术创新实现AI算力释放在性能和收益上的最好平衡，通过生态开放推动技术平权，让AI加速进入千行万业。

“与时代共昇腾！”，不仅是华为提出的口号，更是昇腾生态伙伴以及千行万业加速拥抱AI的时代强音。

千行万业共“昇腾”，人工智能新范式正在发生

将DeepSeek“搬”出实验室

为什么是昇腾？

“技术创新+生态开放”双轮驱动，与行业“共昇腾”

后记：AI行业新范式

特别声明：文章版权归原作者所有，文章内容为作者个人观点，不代表大咖秀专栏的立场，转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)