面对如火如荼的生成式AI大战,全球电商老大亚马逊、云计算老大亚马逊云科技又双叒发力了。就在12月4日举办于美国拉斯维加斯、6万人现场参会的2024亚马逊云科技re:Invent全球大会上,亚马逊CEO Andy Jassy亲自出马,发布了亚马逊自研的新一代基础模型Amazon Nova。
比星巴克的中杯/大杯/超大杯更进一步,Amazon Nova一出手就是“四大杯”:
Amazon Nova Micro:仅限文本对话,主打一个低价格和低延迟;
Amazon Nova Lite:低成本的多模态大模型,处理图像、视频和文本输入的速度极快;
Amazon Nova Pro:高性能的多模态大模型,精度、速度和成本最佳“配方”,可处理广泛的任务;
Amazon Nova Premier:系列中最强多模态大模型,可处理复杂的推理任务,也可用于蒸馏客户定制化的模型。
在现场,Andy还晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等各大权威AI榜单上的分数,虽然不能说是屠榜,不过确实在检索增强生成(RAG)、函数调用和智能体应用等关键指标处于领先地位。
目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier预计将在2025年第一季度可用。
你以为这就够了吗?紧接着,Andy Jassy又发布了两个全新模型:用于生成高质量图像的Amazon Nova Canvas和用于生成高质量视频的Amazon Nova Reel。
亚马逊云科技还计划在2025年第一季度推出“语音到语音”(Speech to Speech)Amazon Nova模型,预计在2025年中旬推出具备“任意到任意”(Any to Any)模态能力的Amazon Nova模型。
总之,别人家有的模型,我亚马逊云科技也都有,用Andy Jassy的话来说就是,“万物皆可生成”。
这是否意味着,接下来亚马逊云科技将“鼓励”用户们都转用Amazon Nova?当然不是。在这次大会上,Andy Jassy还说了一句意味深长的话:“选择决定一切!需要用模型的时候,最关键的是,有很多可选的自由!”
从2024亚马逊云科技re:Invent全球大会上的表现,老冀认为:亚马逊给用户提供的最大价值,恰恰就是选择的自由。而且,这种选择的自由不仅仅只限于模型,也不只是AI架构的中间层,而是涵盖了基础架构层、中间层、应用层的方方面面。
中间层:一百多个模型一站式服务
在发布Amazon Nova之后,亚马逊云科技CEO Matt Garman表示,Amazon Nova将与AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI等多个大模型一起,全部放到Amazon Bedrock当中,供用户选择使用。
实际上,亚马逊云科技自己就是大模型的深度使用者,目前公司内部使用的生成式AI应用超过1000个。亚马逊云科技深知,用户要的是能够解决自己针对性问题的大模型,而不是只有通用能力的、或者只能炫技的大模型。
在这次大会上我们看到,亚马逊云科技成为首家向用户提供Luma AI最先进的Luma Ray 2模型(其著名视频模型的第二代)的云服务提供商。用户可以通过Amazon Bedrock使用Ray 2,依据文本和图像高效生成电影级质感的高质量、逼真视频。
亚马逊云科技还成为首家提供poolside的malibu和point模型访问权限的云服务提供商,这两个模型在代码生成、测试、文档编制以及实时代码补全方面表现出色,能够帮助工程团队提高生产力,更快编写出更优质的代码,并加速产品开发周期。
Stability AI可谓如今最热的文生图大模型开发商之一。如今,Stability AI旗下最先进的文本转图像模型Stable Diffusion 3.5 Large也即将进驻Amazon Bedrock,为媒体、游戏、广告以及零售领域的客户创建概念艺术、视觉效果以及详细的产品图像。
有了如此多当红大模型的加入,亚马逊云科技仍然觉得不够——虽然Amazon Bedrock中的模型能够支持众多任务,但是许多客户仍希望将新兴的专用模型融入到他们的应用程序中,为其独特的用例如分析财务文档或生成新型蛋白质等提供支持。
有鉴于此,在2024亚马逊云科技re:Invent全球大会上,亚马逊云科技继续放出大招,推出Amazon Bedrock Marketplace,直接给用户一个模型市场。
如今,用户已经能够从100多个模型中进行查找与选择,这些模型可部署在亚马逊云科技上,并能通过Amazon Bedrock中的统一体验进行访问。这100多个模型中,既有Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服务等热门模型,还有用于金融行业的Writer的Palmyra-Fin、用于翻译的Upstage的Solar Pro、Camb.ai的文本转音频MARS6以及用于生物学的EvolutionaryScale的ESM3生成模型等众多专业模型。无论你想要什么模型,直接到Amazon Bedrock Marketplace上面来找就对了。
实际上,一些用户已经享受到了这种一站式服务的好处。在这次大会上,Zendesk这家全球服务软件公司,就在Amazon Bedrock中访问用于翻译的Widn.AI等专用模型,通过电子邮件、聊天、电话以及社交媒体对客户服务请求进行个性化和本地化处理,从而为客服人员提供其所需的数据,比如客户母语表达中的情绪或意图等,最终提升客户服务体验。
为了让大家用好生成式AI,亚马逊云科技可谓操碎了心。这次大会上,Amazon Bedrock还发布了一系列的新技术和新功能:
全新的提示词缓存功能和Amazon Bedrock Intelligent Prompt Routing提示词智能路由功能,帮助客户更轻松、更经济地扩展推理业务。
Amazon Bedrock Knowledge Bases现已提供对结构化数据和GraphRAG的支持,进一步拓展了客户利用自身数据提供定制化生成式AI体验的途径。
Amazon Bedrock Data Automation功能能够在无需编写代码的情况下,自动将非结构化、多模态的数据转换为结构化数据,以帮助客户将更多数据应用于生成式AI及分析工作中。·
模型蒸馏:创建更快、更具成本效益的模型,经过蒸馏的模型速度最高提升500%,成本最高降低75%。
Automated Reasoning checks:防止因幻觉产生的事实性错误,提供纠正建议。
Multi-agent collaboration:构建、部署和编排多个agent,协同处理复杂的多步骤任务。
亚马逊云科技人工智能和数据部门副总裁Swami Sivasubramanian博士表示:“通过此次新发布的一系列新功能,我们将帮助客户开发出更智能的AI应用程序,让他们为其最终用户创造更大价值。”
既提供了丰富的模型,又给了好用的功能,难怪有数以万计的客户通过Amazon Bedrock运行其生成式AI应用程序。仅仅在过去一年,使用Amazon Bedrock的客户量就增长了4.7倍。如今,Adobe、Argo Labs、宝马集团、Octus、Symbeo、Tenovos和Zendesk等公司,都已经采用了Amazon Bedrock的最新技术。
基础设施层:三大领域一个都不能少
我们都知道,生成式AI要想获得更广泛的应用,基础设施肯定少不了。从2024亚马逊云科技re:Invent全球大会上,老冀发现亚马逊云科技在这方面同样不含糊,在全面覆盖基础设施的计算、存储、数据库三大领域,为用户提供全家桶的产品和服务。
先说计算。在这次大会上,亚马逊云科技发布了以自研芯片Trainium搭建的AI算力。其中,Amazon Trainium2 Server采用16颗Trainium2 芯片,FP8算力达20.8PFLOPS;Amazon Trainium2 UltraServer则将4个Trn2实例通过NeuronLink互连,搭载64颗Trainium2 芯片,FP8算力达83.2PFLOPS。
在AI算力的超级竞赛中,亚马逊云科技正在加速创新。在本次大会上,亚马逊云科技还宣布将与AI大模型的“当红炸子鸡”Anthropic合作构建一个名为“Project Rainier”的新集群,它将配备数十万个亚马逊云科技最新的AI训练芯片Trainium 2,建成后将比Anthropic当前最强大模型的集群大五倍,成为全球最大的AI超级计算机之一,加入“十万卡集群”的竞争。
亚马逊云科技在计算上的强大实力,已经吸引了很多重量级客户的关注,苹果公司AI和机器学习高级总监Benoit Dupin也专程赶到2024亚马逊云科技re:Invent全球大会站台。他表示,苹果与亚马逊云科技在AI和机器学习生命周期的“几乎所有阶段”都展开了合作。如今,苹果正在对Trainium 2芯片进行初步测试,以帮助训练正在逐渐提供全面服务的Apple Intelligence。
此外,亚马逊云科技还宣布将在2025年推出更先进的自研Trainium3芯片,它将采用3nm先进工艺,性能是上一代的2倍,功耗则只有上一代的40%。
有了自研的Trainium系列芯片,是不是就不再需要英伟达的GPU了?当然不是。要知道,亚马逊云科技始终从用户的角度来考虑这个问题。Matt Garman表示:“今天,在GPU方面真的只有一个选择,那就是英伟达。我们认为客户会欣赏有多个选择。希望Trainium能够开辟出一个良好的细分市场,我认为它将成为部分工作负载的极佳选择,当然不是所有工作负载。”因此,在这次大会上,Matt Garman同样发布了EC2 P6实例,它基于英伟达最先进的Blackwell架构GPU,是上一代性能的2.5倍。
用户希望用什么架构的计算,就给它好了;至于是自研还是合作伙伴的,并不那么重要。
在存储上,亚马逊云科技同样也是用户逻辑,在这次大会上发布了Amazon S3 Tables,将Apache Iceberg表的查询性能提升3倍,每秒事务处理量提升10倍,还发布了Amazon S3 Metadata,提供S3中管理元数据最简单快捷的方式。
用户更大的惊喜,则来自于数据库。我们知道,在分布式数据库系统中,存在一个“CAP魔咒”——跨区域一致(Consistency)、高可用性(Availability )、低延迟(Partition Tolerance)这三大要求,一般只能满足两个。
而在这次大会上发布的新型无服务器分布式数据库Amazon Aurora DSQL却告诉用户:三个要求都可以有!它结合了传统关系数据库的强一致性和NoSQL数据库的分布式扩展能力,提供了以下几大关键优势:
跨区域强一致性和低延迟:采用了全新的架构,使其能够在多个地理区域中同时运行,而保持强一致性。
无限扩展:能够处理数TB到数PB级的数据集,适用于任何规模的企业。
超高可用性:提供99.999%的可用性,这对于许多需要高可用性和无缝运行的企业级应用至关重要。
性能优越:其跨区域的读写操作比Spanner快了四倍。
从2024亚马逊云科技re:Invent全球大会上,老冀看到了亚马逊云科技对用户的宠爱模式:说吧,你想要什么?我全都给你!
应用层:软件开发流程一步步搞定
作为一家平台级公司,亚马逊云科技从来都非常重视开发者的重要作用。在2024亚马逊云科技re:Invent全球大会上, Matt Garman深情地回顾,今年6月他就任CEO之后的第一件头等大事,就是与亚马逊云科技Heroes交流,听取这些技术专家们的意见。此时,台下传来了一阵阵欢呼声。
这一次,为了让开发者们把AI更好地用起来,亚马逊云科技针对软件开发功能强大的生成式AI助手Amazon Q Developer继续发力,推出一系列创新增强功能,包括能够实现自动执行单元测试、文档生成和代码审查流程的智能体,可大幅提升开发人员在整个软件开发流程中的效率;以及能够在极短时间内帮助用户解决运营难题的能力。
编写单元测试对于保障代码按预期运行并及早发现潜在问题至关重要。Amazon Q Developer能够自主识别并生成单元测试,通过全面的测试覆盖,以更少时间帮助开发人员及早发现问题并显著提升代码的可靠性。
开发人员在代码编写和测试阶段之后,通常需要编写文档来阐述代码的功能与运行机制。如今,开发人员可以使用 Amazon Q Developer 生成和维护其所有项目文档,确保他们始终掌握项目的最新信息;同时让他们能够快速上手新代码,为团队成员抓取关键的项目细节,并提升旧文档的可读性。
代码正式部署之前,往往需要另一位开发人员对代码进行细致检查,确保其符合企业要求的质量、风格与安全标准。Amazon Q Developer具备自动检查代码质量、查重和识别安全漏洞的能力,从而简化代码审查流程。它能够迅速向开发人员提供反馈,让开发人员在当前工作流程下,加速部署高质量的代码。
当应用程序编写完毕并投入生产环境后,运营团队便肩负起监控其运行状况、迭代优化及解决问题的重任,以确保应用性能达到预期标准。基于亚马逊云科技丰富的运营经验及对企业和组织的云资源关系的深入理解,Amazon Q Developer现在可以帮助不同经验水平的用户,以更短的时间调查并解决其在亚马逊云科技环境中的运营问题,确保企业应用程序的正常运行。
正如亚马逊云科技下一代开发者体验副总裁Deepak Singh所言,亚马逊云科技的客户正广泛通过Amazon Q Developer,在软件开发生命周期各阶段提升开发人员的生产力。如今,埃森哲、Boomi、BT Group、Cedar Gate Technologies、德勤、FINRA、Genesys、Netsmart、培生、SmugMug以及Tata Consultancy Services等众多企业,都正在使用Amazon Q Developer来提升开发人员的工作效率,并快速解决运营挑战。
看完2024亚马逊云科技re:Invent全球大会的直播之后,老冀突然发现,即使是在日新月异的生成式AI领域,亚马逊云科技仍然能够凭借自身多年的积累,为企业客户提供丰富多样的全家桶产品和服务,帮助企业把AI用起来,用成功。这样的亚马逊云科技,必然也将成为企业客户应用生成式AI的首选合作伙伴。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。