天极大咖秀

登录 | 申请注册

一家主导≠开源,AI时代服务器操作系统发展需要“一人一票”

大数据在线 2024-09-12 阅读: 2,111 次

AI时代,中国服务器操作系统正展现出前所未有的产业活力。

一方面,CentOS宣布停止维护之后,中国加速发展服务器操作系统产业,带来巨大的市场契机;另一方面,AI正成为影响服务器操作系统未来创新发展的最大变量,驱动着服务器操作系统产品、生态走向全面重塑。

龙蜥社区是当下中国服务器操作系统茁壮成长的一个缩影。社区成立五年以来,龙蜥操作系统各种版本的装机量突破800万套,汇聚超过1000家产业链上下游生态伙伴,并且在互联网、金融、政务等多个行业中得到广泛部署与应用,逐渐走出一条切实可行和良性发展的开源服务器操作系统产业之路。

正如龙蜥社区副理事长张东所言:“独行快、众行远。龙蜥社区在各个层面的核心企业与生态广泛性方面取得较好平衡,生态中既不会出现一家独大的情况,又驱动着参与者们在各个环节主动付出,有利于社区长期、健康发展。”

AI时代,操作系统全面走向变革

在这一轮的AI技术浪潮中,操作系统已全面走向变革。

与手机、PC等客户端操作系统如火如荼拥抱AI的情况类似,服务器操作系统也在酝酿着巨大的变化。作为在数据中心中扮演着“承上启下”角色的服务器操作系统,既需要在自身产品层面更好地与大模型等AI技术融合,让操作系统也走向智能化;又需要“对下”更好地适配好GPU、DPU等多元算力,管理好全新规模的硬件环境;更需要“对上”支撑好成千上万智能应用的涌现。

“一切变化源自于快速迅速的AI技术,激发数据中心硬件、操作系统巨大变化。不过,基础设施扩张是有边界的,需要在规模、能耗和成本之间进行平衡。如何以更低成本、更小空间完成各项任务,对于服务器操作系统还有很大的创新空间。”张东如是说。

首先,服务器操作系统正加速与AI相融合,AI原生的服务器操作系统是重要发展方向,从而让操作系统的效率和易用性得以显著提升。以龙蜥操作系统为例,利用AI助手Copilot,让各种人员在使用操作系统上更加便捷与高效。龙蜥社区技术委员会主席杨勇介绍,龙蜥操作系统一直在强化AI原生的优势,持续探索如何利用AI能力去提升用户体验。

其次,以大模型为代表的AI技术彻底改变了基础设施的规模和复杂性,服务器操作系统需要去全方位适配超大规模、多元算力环境,并且能够更好地管理和分配资源以及做好运维管理。例如,Meta最新报告就指出其Llama 3大模型在万卡集群训练下,45天时间出现数百次故障报错,对于基础设施挑战可见一斑。

在中国,千卡、万卡规模的AI集群也在不断涌现,未来对于服务器操作系统挑战不可低估。张东直言:“现在操作系统需要管理的处理器核心和任务线程数量呈现出指数级的增长。例如,现在AI应用对于内存需求极大,内存容量大幅增加之后,操作系统做一次内存遍历都具有极大的挑战。”

据悉,龙蜥操作系统最新Anolis OS 23版本大幅增加对于基础设施的管理调度能力,包括多平台的兼容性,全面支持各种处理器、算法库以及AI框架,更好支持像大模型的训练、推理等。

综合来看,进入到AI时代,服务器操作系统在基础设施领域担当的“大脑”角色会越来越重要,肩负起数据中心可靠性、基础设施可观测性以及全链路优化等重任。

发布三大计划,龙蜥社区显担当

不同于其他类型的软件产品,服务器操作系统的用户粘性极强,一旦在用户环境中得到部署,通常会得到连续性使用。

因此,CentOS彻底停服的确给中国企业带来巨大的影响。对于中国企业而言,新的服务器操作系统在现实情况中需要做到兼顾过去、深耕现在和着眼未来。

“兼顾过去”就是需要新服务器操作系统能够兼容过去的环境和应用,在迁移方面做好保障,确保用户业务的连续性;“深耕现在”则是针对当前操作系统的挑战和AI技术趋势,很好地满足用户业务对于操作系统的新需求;“着眼未来”则是需要清洗的技术与产品规划路线,最大程度给予用户对于新操作系统产品的信心。

针对目前国内企业的现状,龙蜥社区为此正式发布“CentOS替代计划”、“Anolis OS 23生态衍生计划”、“AI应用推广计划”三大计划。

“CentOS替代计划”更多是从实际情况出发,通过安全接管、迁移和延保等,确保企业在CentOS停服之后的使用与保障。例如,浪潮信息作为龙蜥社区的成员,已经联合龙蜥社区推出“停更无忧”行动计划,不仅帮助用户有效防范CentOS停服之后的系列安全风险,还通过多种迁移工具和方案确保用户平滑过渡。

开源操作系统随着时间的推移,必然会产生内核不统一、衍生版本众多、兼容性等挑战,一定程度也为后续的产品研发、用户使用和路线规划带来诸多麻烦。为此,龙蜥社区的“Anolis OS 23生态衍生计划”,旨在通过产业链上下游合力,整合技术的内核、供应链等社区参与的标准,形成一套机制统一内核、工具链和API。

“操作系统碎片化问题挑战巨大,系统厂商的任何新产品或者引入新布局,已都需要进行大量测试。”张东如是说。事实上,“Anolis OS 23生态衍生计划”获得了产业链诸多伙伴的支持,目前已经有12个衍生版本推出。以浪潮信息为例,其基于Anolis OS 23的商业衍生版云峦KeyarchOS,不仅在产品性能、智能化、安全能力等实现全面升级,还针对AI原生应用场景进行大量优化,完美适配当下企业对于服务器操作系统的各项需求。

针对未来AI应用的大趋势,龙蜥社区还推出“AI应用推广计划”,发布“AI原生操作系统”发展路线,围绕AI容器镜像、智能运维AIOps、OS Copilot文档建设等,持续推进龙蜥操作系统AI原生属性的建设。

脚踏实地,操作系统生态才能玉汝于成

在根基础软件领域,从来就没有“换道超车”,服务器操作系统更不能例外。

不能否认,近年来我国的开源操作系统产业取得了长足进步,但与国外成熟的产业生态尚有差距。作为基础软件皇冠上明珠,一款服务器操作系统的成功,技术力和产品力决定下限、生态力泽决定上限。技术和产品层面需要具备持续的先进性,能够支撑起严苛且多变的业务场景;其二,生态具有成长性和持续性,吸纳产业链上下游生态伙伴广泛且深度参与其中,形成繁荣的产业生态。

因此,一款全新的服务器操作系统从萌芽到茁壮成长更像是功不唐捐、玉汝于成的过程。杨勇认为,操作系统与其他产品不同,天然具有复杂性,需要技术、产品与生态三个飞轮不断迭代与协同,需要产业链合作伙伴真正参与进来,一点一滴不断积累与提升,最终让整个社区取得成功。

事实上,为了让龙蜥社区健康、良性成长,龙蜥社区正在走一条开源操作系统的新路,从决策机制采取开放、中立的原则,把产业链伙伴汇聚在一起,通过一人一票的方式,让产业伙伴能够主动参与其中,并且真正从中得到共赢。杨勇表示:“一个开源社区,每个参与者做出社区贡献的同时,也知道能从社区获得什么收益,那一定能成为持续能成长的社区。”

以浪潮信息为例,自从加入龙蜥社区之后,一直积极参与到社区贡献之中。例如,为了支持龙蜥操作系统在AI领域的发展,浪潮信息将在操作系统积累的语料库贡献给社区,推动龙蜥操作系统在AI时代的快速发展。

“服务器操作系统的未来,AI原生First、应用导向和开放中立是三大核心方向。强化开放中立社区定位,共治共建共享。”张东总结道。

大数据在线
洞悉技术趋势,聚焦产业发展

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)