在推理、数学、编码、多语言理解和视觉方面,Claude 3在多个基准测试上树立了新的标准,性能超越了包括GPT4在内的其他模型,被认为是通用大模型新皇。
与此同时,亚马逊云科技宣布,Claude 3系列将入驻其生成式AI托管服务Amazon Bedrock。亚马逊云科技的客户将可以通过Amazon Bedrock访问Claude 3系列的三个模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。
Claude 3对于通用大模型发展带来哪些改变?对于更多想要用好大模型的企业,什么是更好的使用通用大模型的方式?以下是笔者的一些观察。
冲破一家独大,Claude3成通用大模型新“卷王”
此次推出的Claude3共有三个模型,性能和价格由低到高为:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,也被形象概括为中杯、大杯、超大杯。
其中,Claude 3 Haiku 主打快速紧凑,即时的响应能力。Claude 3 Sonnet 在智能和速度之间取得了理想的平衡,特别适合企业用例。Claude 3 Opus具有深度推理、高级数学和编码能力,在高度复杂的任务上具有领先性能。
Claude 3的领先之处体现在基准性能、视觉能力、复杂开放性问题处理能力等。
基准性能方面,Claude 3在多项AI系统常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K),均取得领先业界LLM的性能。
Claude 3的三个模型均具备视觉功能,可以理解不同格式的结构化和非结构化数据,包括图像、图表、图表等。比如,官方演示视频中,Claude 3 Opus可以在几分钟内分析全球经济、未来美国GDP走势等。
对于下图这样的复杂开放式问题, Claude3能够理解物体的外观及其与数学等概念的联系。
此外,Claude3的三个模型都将至少支持200K token的上下文窗口。在200K token的「大海捞针」(NIAH)测试中,Claude 3 Opus准确率超过99%。Claude 3 Haiku 能够3秒读完10k token论文。
笔者认为,目前大模型发展呈现两条不同的路径:
一条路径,围绕如何练好大模型。像OpenAI、Anthropic、Google这样的科技巨头,有能力和资源在通用基础大模型赛道竞争。通用基础大模型的赛道相对同质化,各家都在追求更高更快更强,即更强大更全面的性能。
而且通用大模型的竞争态势一直是动态变化的,任何一家的领先都是暂时的,榜单随时可能被刷新和超越。在这种态势下,任何一家独大,强者恒强未必对行业、对生态更好。
从这个意义上,Claude3能够打破OpenAI长期领先的优势,加速通用大模型卷出更高的智能水平。
另一条路径,围绕如何用好大模型。如何用大模型的能力解决不同行业不同场景下的专业问题,才是绝大多数企业最关注的。在这条路径上,云计算正发挥着举足轻重的价值。
云计算,使用基础大模型的必经之路
目前,AI大模型已经成为云计算厂商的第二增长曲线,全球头部云计算厂商都将AI大模型作为下一个十年发展的必争之地。
如果我们回到企业需求的视角,企业使用基础大模型至少有以下几个核心诉求:
首先,数据安全与合规
数据安全合规是企业使用大模型的首要考量,包括数据泄露风险、数据滥用风险、模型安全漏洞等等。比如,很多企业担心客户信息、商业秘密和个人身份信息等敏感数据泄露。这些都对提供大模型能力的公有云厂商提出了更高的要求。
在如何保障大模型安全使用方面,亚马逊云科技率先做出了很多探索。比如,Amazon Bedrock 处理的任何客户内容都会被加密,并静态存储在客户使用的亚马逊云科技区域中。客户可以使用Amazon PrivateLink建立从Amazon Virtual Private Cloud(VPC)到Amazon Bedrock的私有连接,而无需将VPC暴露给互联网流量。用户输入和模型输出不会与任何模型提供商共享。Amazon Bedrock还提供全面的监控和日志记录功能。
图片来自摄图网
其次,丰富的基础模型选择
没有任何一款大模型可以满足所有需求。
企业在使用大模型时,一定是博采众长,多款并用的。笔者观察到,很多企业在开发垂直领域的企业服务大模型时,底层都接入了不止一个头部大模型。
在头部云厂商中,以亚马逊云科技为例,丰富的基础模型选择也是其在大模型赛道的差异化优势。目前,Amazon Bedrock平台的大模型提供商扩充至7家,包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。
“回顾2021年,当 Anthropic第一次开始在亚马逊云科技上构建时,没有人能想到Claude系列模型会带来多大的变革。自Amazon Bedrock于 2023年9月28日全面上线以来的短短几个月内,已有超过10,000名客户使用它,其中许多客户正在使用Claude。”亚马逊云科技数据和AI副总裁Swami Sivasubramanian博士表示。
目前,已经有不少头部企业在云上使用Claude创建生成式AI应用。比如,全球领先的生物制药公司辉瑞正通过Amazon Bedrock使用Claude模型,加速创新癌症治疗方案的研发。通过运用生成式AI技术,辉瑞能够大幅缩短收集相关数据和科学内容所需的时间,进而利用这些内容分析趋势、制定肿瘤学目标并进行验证,从而提高成功概率。
第三,易用的AI平台和工具集
云计算厂商并非仅仅提供AI大模型的底层基础设施和基础模型接口,更关键是提供系统化的AI平台和工具集,帮助企业更好使用大模型进行创新。
比如,Amazon Bedrock推出了丰富的AI功能,包括帮助客户识别、比较模型的模型评估功能、简化生成式AI应用构建并利用专有数据提供定制化响应的知识库功能、模型调优功能、能执行多步骤业务指令的代理功能、实现负责任AI的Guardrails安全功能等。
Claude3的出现,让生成式AI领域再度风起云涌。Claude3不仅刷新了基础大模型的性能,也打破了长期以来通用大模型领域一家独大的市场格局。
同时,亚马逊云科技与Anthropic的强强联合,不仅能让更多企业在云上便捷使用更新更强大的通用大模型,也代表了企业首选在公有云上使用大模型能力和生成式AI的发展趋势。