天极大咖秀

登录 | 申请注册

云栖大会上的大模型,一文读懂阿里云的生成式AI全战略

于洪涛 2023-11-08 阅读: 5,075 次

生成式AI如同一声惊雷,打破了云计算市场原本的宁静。

无论是国外的微软、亚马逊、谷歌,还是国内的阿里、华为、百度,云巨头们都成为生成式AI的积极参与者。除了推出各自的大模型服务,他们还在为更多的大模型提供算力服务。

在2023云栖大会上,大模型也不出意料地成为头号话题,浓度远超过排名第二的Serverless。现场的多数内容主题都与大模型相关,甚至是围绕大模型而展开。

在本文中,通过对云栖大会上大模型相关发布的梳理,我们可以清晰了解阿里云在生成式AI市场的战略和举措,包括自有的大模型服务、为AI模型提供算力支持、大模型应用开发平台、原有云服务的Copilot等领域。

00

理念:云与大模型是电和电动机的关系

在云栖大会开幕式上,阿里巴巴集团董事会主席蔡崇信阐释了阿里云的新愿景:“打造AI时代最开放的云”。他表示,随着AI大模型技术的迅速发展,智能化时代正在开启,AI将成为各行各业的新型生产力,并对算力提出更高要求。为此,阿里云将加大研发投入,从底层算力到AI平台再到模型服务,进行全面的技术升级和创新。

显然,阿里云把自己与AI进行了深层次的绑定,认为AI将成为云计算发展的未来驱动力。

中国工程院院士、阿里云创始人王坚的演讲,更能准确体现阿里云对于生成式AI与云服务关系的看法。

他认为,“云计算与大模型”之间是“电和电动机”的关系——未来云计算的算力都会被这些智能时代的电动机,即模型消耗掉。这是因为,将来所有的AI计算,都会以云的方式来提供。

为此,王坚还提出了“云计算的第三次浪潮”的观点,指的就是人工智能和云计算的结合,而前两次浪潮分别是互联网企业上云和传统企业上云。

11

架构:构建在IaaS和PaaS之上的MaaS服务

上面这张图,“智能时代的云计算技术体系”,实际上体现了大模型在阿里云业务架构中的地位。

在整个云计算体系中,阿里云自下而上分别提供IaaS、PaaS和MaaS服务。其中MaaS(模型即服务),是阿里云的最顶层业务,也是离企业的业务和应用最近的服务。

值得注意的是,整个体系架构并不是今年新发布的,而是去年的云栖大会上就提出来的。当时,GPT的热潮还没有到来,阿里云就提出了模型即服务理念,推出了AI模型社区“魔搭”,并与合作伙伴一起提供了300个预训练的基础模型,企业用户可针对具体场景进行调优。

在今年的云栖大会上,阿里云CTO周靖人表示,面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系

他介绍说,目前中国有一半大模型企业跑在阿里云上,活跃在魔搭社区上的AI开发者则有280万。

22

产品:由AI基础设施提供的算力服务

对于云厂商来说,生成式AI带来的市场机会主要来自两个方面:一是大模型(基础模型)的行业应用,这方面仍处于探索期,真正的落地机会还不多;二是为大模型的训练和推理提供算力服务,这方面的业务收入已经开始增长,对营收规模起到了拉动作用。

后者主要来自云厂商的AI基础设施产品,包括计算、存储、网络、数据库等。值得注意的是,整个云产品都在朝着AI化和Serverless化的方向发展。

在底层基础产品之上,阿里云还针对机器学习的算力管理调度需求,推出了人工智能平台PAI。PAI包括两个部分:用于模型训练的PAI灵骏,这是一个超高性能分布式模型训练平台;以及用于模型推理的PAI灵积,这是一个超低延时的模型推理与服务平台。

周靖人表示,阿里云已成为中国大模型的公共AI算力底座。国内众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、百川系列、智谱AI ChatGLM系列、姜子牙通用大模型等,当然还有当下火爆全网的妙鸭相机。

33

服务:阿里云自己开发的通义系列大模型

在AI基础设施之上,是阿里云自己开发的大模型服务,即“通义”系列大模型。这些大模型除了直接供给终端用户使用之外,更提供了API以方便企业进行应用集成

目前,通义大模型家族共有10个成员。

其基础大模型,包括“通义千问”和“通义万相”。通义千问是主打人机对话的大语言模型。在2023云栖大会现场,阿里云发布了最新的千亿参数的通义千问2.0。通义万相则是AI艺术创作大模型,用于生成图片。

在基础大模型之上,则是阿里云的8个行业应用大模型,包括工作学习AI助手“通义听悟”、个性化角色创作平台“通义星尘”、智能编码助手“通义灵码”、企业坐席客服助手“通义晓蜜”、智能投研助手“通义点金”、AI阅读助手“通义智文”、AI法律顾问“通义法睿”、专业健康助手“通义仁心”。

与阿里云一样,其他云巨头也都推出了自己的大模型服务。不过亚马逊云科技的Titan大模型并不直接面向最终用户,只供其Bedrock开发平台调用。阿里云的“通义灵码”,则与亚马逊云科技的CodeWhisperer对标。

 

开发:托管的一站式应用开发平台

当下,各行各业都在积极探索如何利用大模型来提升自己的业务效率。但企业要想训练自己的大模型,并付诸应用,却并非易事。除了庞大的算力和数据需求之外,针对特定场景的定制、与业务系统的集成、数据的安全等,都是企业在大模型应用中的难题

云厂商正可以发挥自己提供托管服务的优势,结合算力资源和基础模型资源,来帮助企业落地大模型应用。

在2023云栖大会上,周靖人发布了其一站式大模型应用开发平台“阿里云百炼”。百炼的名字取自“百模重器,千锤百炼”,接入了通义系列大模型和主流第三方大模型,为企业提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,简化了企业的底层算力部署、模型预训练、工具开发等复杂工作。

周靖人称,借助阿里云百炼,开发者可在5分钟内开发一款大模型应用,几小时即可训练出一个企业专属模型,让开发者可以把更多精力专注于应用创新。目前,央视网、朗新科技、亚信科技等企业,已率先在阿里云百炼上开发出了自己的专属模型和应用。

阿里云百炼被认为对标于亚马逊云科技的Bedrock,两者的功能非常相似。后者除了接入其自己的Titan基础模型,还接入了Meta的Llama2、Anthropic的Claude2,以及Stability AI、AI21 Labs、Cohere等第三方的基础模型。

针对大模型开发者,阿里云还在走开源路线,专门为AI模型建设了魔搭社区。据了解,通义千问的7B、14B版本已经开源,72B版本也即将开源;而魔搭社区中的模型总数超过2300个,总下载量过亿。


从以上战略解析可以看出,阿里云认为云计算已经进入到AI新时代,正在全面拥抱AI,拥抱生成式AI。

围绕生成式AI的能力建设,也将成为各大云厂商未来一段时间的工作重心。由此建立起的新的核心竞争力,或许将会改变云计算市场的现有格局。

于洪涛
科技智库领域优质创作者

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)