天极大咖秀

登录 | 申请注册

英伟达、阿里云停供算力产品,谁来拯救“受伤”的大模型企业?

海峰看科技 2023-11-09 阅读: 2,296 次

文/黄海峰的通信生活

2023年,百模大战一触即发!继区块链、元宇宙等新名词后,大模型成为行业大佬竞相抓住的下一个风口。根据9月份高通发布的《混合AI是AI的未来》显示,国内已发布79个10亿参数规模以上的大模型。国外除了Chat-GPT,马斯克最近也推出首款大模型产品——Grok,以“喜爱讽刺”的傲娇性格获得不少用户喜爱。

生成式AI正在加速奔跑,渗透进千行百业,但万丈高楼平地起从来不是神话,正如地基之于高楼大厦,“大”模型的发展也离不开“大”算力。但是算力的供应出现了太多的不确定性。

近期,因算力需求旺盛、供给紧张,有媒体报道,阿里云算力租赁供应捉襟见肘,其A100服务器已宣布暂停对外出租。而就在10月,美政府将禁止英伟达AI芯片对中国销售。

面临突然的算力断租、断供,企业呼唤稳定、可持续的算力底座,谁能助力互联网企业和大模型公司,拥抱未来十年的大模型黄金时代?我们有没有更优的选择?

算力产品面临断供,最受影响的是互联网厂商与大模型公司

算力作为大模型时代的核心驱动力,直接决定着大模型的迭代与创新速度,算力的稀缺性已成为制约大模型发展的瓶颈所在。

今年10月,美国商务部对英伟达运往40个国家的芯片提出额外许可要求,以避免转售给中国,生效日期也从11月16日提前至10月23日,国内阿里、字节、百度等大厂均受到牵连,英伟达在国内的50亿美元订单化为泡影。

从阿里云和英伟达相继传出的消息可以看到,美国对中国科技界的打压正在逐渐加码、愈演愈烈。大家更为关心的是,该事件将给行业带来哪些影响?

一方面,断供会产生巨大的服务器和GPU缺口。根据浙商证券数据显示,国内15家头部大模型厂商对标GPT-3模型的训练需求,需要1920台A100/A800服务器,对应15360张GPU。如果考虑国内5家头部大模型厂商对标GPT-4模型的训练需求,则额外需要13705台A100/A800服务器,对应近11万张GPU。

另一方面,互联网公司最为“受伤”。当移动互联网时代远去,互联网企业日渐式微。百度、腾讯、阿里等互联网领域佼佼者本想借着大模型春风直上青云,却迎来“釜底抽薪”的困境。根据清科集团发布的《2023年上半年中国股权投资市场研究报告》显示,上半年国内互联网领域投资案例数与投资金额双双下滑,均已跌出热门投资行业前五位。

面对大模型带来的时代性机遇和AI算力产品服务断供的“峡谷地带”,许多互联网厂商选择了“能租就不买”策略,这使得算力租赁成了一门好生意。

以通信网络解决方案和服务商中贝通信为例,其以H800设备为基础搭建算力服务平台,服务费从9月份的12万元/P/年涨到10月份的17.9万元/P/年。仅一个月时间,涨幅达到50%。

但算力租赁只是一个短期买卖,不能解决本质问题,那该怎么办?因此,算力产品国产化替代从部分企业不愿意为之的“可选项”变为每个企业学会取舍的“必选项”。选择可靠伙伴做同路人,唯有如此,互联网企业才能“杀出峡谷”,拥抱大模型发展的黄金十年。

盘点互联网大厂近两年动作,在AI算力方面能顶上来的不多。据《45家国产AI芯片厂商调研分析报告》显示,阿里倚天710是CPU,用于逻辑计算,而非AI推理训练;百度昆仑芯2代被应用于文心一言大模型推理端,训练端使用的是英伟达V100和A100;腾讯紫霄定位中低端,用于AI推理。

不过笔者关注到,嗅觉灵敏的百度已于今年8月份下订单,向华为订购AI芯片,作为英伟达A100芯片的替代品。除此之外,中贝通信、恒为科技等算力运营商也已经与华为达成相关合作。

与此同时,我们看到大量互联网厂商并非自建算力基础设施,而是通过向云服务厂商购买云AI算力,来降低获取大量算力的成本和门槛。在该领域,提供昇腾AI算力服务的华为云,同样给了广大互联网厂商新选择,据了解,很多大模型公司也开始与华为云展开洽谈与合作。华为确实正成为国内继英伟达之后的“第二选择”。

迎战大模型时代,中国企业需要“抱团前行”

今年科大讯飞也重磅投入大模型研发,并在8月联手华为发布星火一体机,其董事长刘庆峰就表示,大模型在各个行业深度应用,最关键要具备三大要素。其中首个要素就是安全可控,内容要安全,算力要安全,要把未来发展构建在完全自主可控的平台上。“国外的算力现在不见得能买得到,就算买到训练完以后,安全性也很难得到保障。”刘庆峰如此说。

熟悉华为的朋友知道,迎战大模型时代,华为给自己的定位是“百花园”的黑土地,即通过算力底座、AI平台、开发工具,支持大模型在智能化时代的“百花齐放”。

区别于其他云服务商,华为基于自身的“厚”积累,走出特色之路。一方面,面向计算,华为以硬件交付为主、提供算力业务。另一方面,面向客户,华为云以软件交付为主、提供服务业务。

我们来盘一盘华为云在算力服务方面的“技能点”。首先,华为云在贵安、乌兰察布、芜湖打造了3大AI云算力中心,为企业提供澎湃昇腾AI算力,企业和开发者无需自建AI数据中心,即可直接使用业界主流的开源大模型,让企业不再需要高价抢购“电子黄金”——GPU,无惧GPU断供挑战。

此外,华为云还推出昇腾AI云服务,提供算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts,为大模型应用开发、运行提供最佳算力服务。

王沉森在《天才为何成群而来》中写道:研究工作是没有地图的旅程,是孤独旅行者在未知的地方摸索。

当下AI算力的断供、断租,让华为“孤独的研究工作”迎来一轮收获期。

笔者观察:警惕AI算力这头“灰犀牛”

米歇尔·渥克在《灰犀牛》一书中,将未来的潜在危机比喻为灰犀牛,因为灰犀牛虽体型庞大却常常被人忽视。对于企业来说更是如此,将算力服务的供应链寄希望于美国,无异于将高楼大厦的地基打在沙子上,企业长远发展愿景也将随着沙子的沉降作用而坍塌。

在灰犀牛的身上,我们也能看到“危机时刻,正是改变之机”,与其等别人随意卡脖子,拿走降落伞无处落地,不如自己造降落伞。

解难题,做难事,行稳致远。华为Mate60系列今年一鸣惊人,依靠创新能力,无惧险阻,一路奔腾,在终端领域做到消费者心目中的遥遥领先,让无数人喊出“轻舟已过万重山”。

华为云则如云计算领域的“Mate60系列”,从基础软件GaussDB,到盘古大模型,再到新一代工业软件体系,华为云持续技术创新解难题,构筑起业界领先地位,给了企业一个稳定的、可持续演进的选择,助力企业征战大模型的黄金时代。

我们很开心有这样的选择,我们也很庆幸有这样的选择。

海峰看科技
独立科技评论员,《海峰看科技》账号创始人,多次接受央视、环球时报、科技日报等采访。 ICT行业杂志前副主编,从业十多年,聚焦5G、手机、IoT、光、云、AI、互联网、智能汽车、机器人等。 每年与超100位科技行业企业CXO/VP/总监面对面交流。 多个年度《中国信息通信行业发展报告》特约撰稿人。 毕业于北京邮电大学,曾获十大通信行业自媒体称号。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)