天极大咖秀

登录 | 申请注册

大模型时代,昇思跑出创新使能“加速度”

闫跃龙 2024-03-27 阅读: 1,544 次

当下最火的是什么?绝对是人工智能。在人工智能发展的过程中,人工智能框架扮演着至关重要的角色,它为开发者提供了一个高效、灵活、便捷的开发工具,加速人工智能技术的创新和应用。

昇思MindSpore,是国内主流的开源框架,开源四年来发展迅速。3月22日,昇思人工智能框架峰会2024上披露的数据显示:访问量已达数千万,超过687万下载安装使用,在码云千万开源项目中综合排名第一,服务企业数量超过5500家,合作高校360所,2023年以来基于昇思框架发表的顶级会议论文数量超过1200篇,在所有AI框架中排名中国第一,全球第二。

值得注意的是,昇思MindSpore在大模型时代使能创新的技术进步也在提速,正在跑出应用的“加速度”。

昇思跑出应用“加速度”

商汤科技,是AI领域的领军企业,其打造的SenseCore商汤大装置搭建了完善的AI原生基础设施,包括算力基础架构、大模型生产平台、模型即服务。

这背后就有昇思的助力。商汤科技联合创始人、大装置事业群总裁杨帆透露,商汤与昇思共建大模型训练新生态,具有大模型专家并行训练优化、超长序列大模型训练实现、大模型训练性能提升、大规模异构算力兼容等技术特点。其中通过昇思支持并优化具有万亿参数规模的混合专家模型(MoE)训练的效率,相比FasterMoE等系统提升30%的训练性能,解决了当前深度学习模型规模扩大带来的计算和通信瓶颈问题。

而通过昇思高效实现相关策略,商汤解决了长序列训练中的显存、通信和计算瓶颈,实现了32k到1M级别序列长度transformers模型训练,提升了模型处理能力和应用范围。

无独有偶,另一家在大模型领域处于前列的百川智能同样得到了昇思的助力。百川智能发展迅速,成立以来平均每28天发布一款新模型,其开源模型Huggingface总下载量超过700万次,在业界居领先水平。

百川智能技术联合创始人陈炜鹏透露,百川智能和华为的工程师一起实现了百川系列模型在昇思框架上的预训练、微调、部署等,基于昇思训练,算力利用率提升了一倍,双方也在联合探索万亿MoE架构模型的创新和优化。百川开源大模型首发上线昇思社区,昇思大模型平台提供在线体验服务。据了解,百川智能与鹏城实验室合作研发的“鹏城-百川-脑海33B”长窗口大模型,是算力平台上最长的上下文窗口模型。

IDC中国副总裁钟振山表示,人工智能开源框架是产业发展的基石和纽带,目前开源框架在互联网行业渗透度最深,同时金融、工业、零售、医疗等领域也有相对更多的人使用。昇思MindSpore在生态建设方面取得了优异的成绩。

笔者注意到,昇思在其他领域的应用也在提速。例如,中国科学院院士、中国空气动力学会理事长唐志共表示,其团队基于昇思AI框架自主创新开发的生成式气动设计大模型平台,在模型的开发、训练、部署等阶段都获得了很大助力,打破了传统设计范式,飞行器的气动外形设计时长从之前的月级缩短到分钟级。

昇思人工智能框架峰会2024上展示的数据展现出昇思在开源后的应用加速度,据预估,在2023年新增人工智能算力覆盖的深度学习框架市场份额中,昇思MindSpore占比达18%,原生、适配大模型从20+增长到40+。

昇思正在跑出助力千行百业智能化的“加速度”。

向下扎到根,向上育生态

为什么昇思在如此短的时间内就发展迅猛,尤其是能加快进入千行百业?归结起来,是:向下扎到根,向上育生态。

向下扎到根,是昇思开源社区始终聚焦根技术,不断进行技术创新。以刚发布的昇思MindSpore 2.3版本为例,就瞄准大模型时代,解决了诸多痛点,堪称是大模型时代的首选AI框架。

具体来说,大模型正在从千亿的稠密走向万亿的稀疏,这让人工智能框架的并行计算能力、简洁的编程能力、便捷的部署能力成为大模型训练的关键要素。昇思MindSpore 2.3版本就是这样,其以原创的多副本、多流水交织等八种并行技术,达到了90%的集群线性度,相比业界不足60%的水平大幅提升,而通过整图优化和下沉执行等,将算力利用率从业界的不足40%提升到55%。针对集群故障率高、恢复时间长等普遍问题,昇思通过编译快照、确定性CKPT等技术将故障恢复时间降低到20分钟。同样,昇思通过训推一体大幅缩短了大模型的推理部署周期,通过LLM Serving将推理吞吐提升2倍多,升级的模型压缩工具实现了千亿大模型压缩至10倍。

昇思MindSpore技术总经理于璠这样总结昇思MindSpore 2.3版本:开发效率倍增、效能倍增、推理成本倍降。这一切,都是根技术深耕的力量,昇思已经做好了应对万亿参数大模型时代的技术准备。

向上育生态,是昇思MindSpore开源社区持续打造生态,赋能开发者,不断推动昇思应用生态的繁荣壮大。在这次峰会上,昇思赋能学术和生态的四项行动发布。如其中的昇思开发板应用创新行动,基于香橙派开发板,提供系统化的案例、教程和支持,降低了开发者上手和打造应用的门槛。而专项的技术支持和市场联合推广行动,也将加速原生大模型的孵化速度。

大模型需要和各行业深度融合,落地部署为应用才能转化为生产力。昇思就走在这样的路上:向下扎到根,让昇思AI框架能够形成“洞察痛点-技术创新-解决痛点”的正循环;向上育生态,让昇思的生态圈不断繁荣,尤其是推动大模型和行业走向深度融合。

后记:人工智能“+”千行百业

今年的全国两会,首次将“人工智能+”写入政府工作报告,引发业界的极大关注。

一方面,“人工智能+”意味着国家对人工智能的高度重视,将人工智能的发展放到战略级高度。就像中国工程院院士、中国人工智能学会副理事长何友所说,人类社会发展已经迈过了蒸汽机时代、电气化时代、机械化时代、信息时代,在这些时代里中国主要是旁观者和跟随者,今天在经历着向人工智能发展的变迁过程。基于国家的创新战略、人才优势、巨大的市场和强大的国力,我国一定会成为新时代的参与者、推进者、见证者。

另一方面,“人工智能+”意味着人工智能只有赋能千行百业才能真正落地转化为价值。这也是昇思这样的人工智能框架的价值所在。昇思人工智能框架作为算法应用和硬件算力之间的桥梁,持续帮助用户解决部署挑战。从大的维度看,昇思人工智能框架也是人工智能技术与千行百业之间的桥梁,成为人工智能赋能千行百业智能化的关键基座。

换句话说,从某种程度上说,昇思人工智能框架就承担着“人工智能+”中的“+”的角色。

可以相信,伴随昇思MindSpore开源社区的壮大,根技术不断耕耘,生态圈持续繁荣,千行百业智能化将能进一步按下加速键。

闫跃龙
知名科技自媒体,资深互联网营销和公关专家,大变革 大机会!

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)