天极大咖秀

登录 | 申请注册

透过re:Invent大会,看AWS如何让机器学习扩圈?

智能进化论 2020-12-27 阅读: 9,172 次

在12月1日-18日首次于线上举行的亚马逊re:Invent大会上,机器学习是绕不开的一个重磅内容。作为全球云计算引领者,亚马逊云服务 (AWS)对于机器学习的最新理念、技术迭代和应用探索都对机器学习领域的发展有着深远的影响。

12月9日,AWS全球机器学习副总裁Swami Sivasubramanian (简称Swami)在re:Invent大会上展示了AWS关于人工智能与机器学习的最新全景蓝图,并发布一系列新服务和新功能。目前,已经有超过10万客户在使用AWS的机器学习服务。

Swami认为,“目如今可以毫无不夸张地说,云计算释放出巨大的力量,帮助各种创业公司和成熟企业取得了巨大的成功。机器学习目前就处于那样的早期阶段。”

2020年3月,Gartner发布了首份云 AI 开发者服务(Cloud AI Developer)魔力象限,AWS 被评为领导者。AWS已经成为机器学习两大框架在云上开发的主流选择。目前,在云上运行的92%的基于Tensorflow框架的机器学习工作负载(半年前这一数字还是85%),以及云上运行的91%的基于PyTorch框架的工作负载都跑在AWS云上。

2020年,AWS在人工智能与机器学习方面,有哪些值得关注的新动作?透过re:Invent大会可以看出,从基础设施到Amazon SageMaker再到上层应用全面升级、将机器学习赋能数据库开发者和数据分析师、推出开箱即用的工业领域机器学习解决方案是值得关注的几个重点。

透过re:Invent大会,看AWS如何让机器学习扩圈?

机器学习三层工具集全面升级

AWS的机器学习服务整体框架分为三层。今年,这三层服务全面升级,升级的原则就是:更多选择、根据客户需求“量体裁衣”。

透过re:Invent大会,看AWS如何让机器学习扩圈?

底层是框架和基础设施层,AWS用框架+算力打造了丰富而强大的机器学习基础。框架方面,AWS支持TensorFlow、PyTorch、MXNet等主流机器学习框架和接口标准。算力方面,对英伟达、英特尔、AMD、赛灵思等主流芯片厂商的最新处理器的支持一应俱全。

今年的re:Invent大会上,AWS推出了全新的机器学习训练芯片AWS Trainium,与标准的AWS GPU实例相比,可带来30%的吞吐量提升,降低45%的单次引用成本。同时,Trainium支持与去年发布的自研推理芯片AWS Inferentia相同的SDK。

中间层是Amazon SageMaker,其提供了首个全托管的机器学习集成开发环境,针对的是有一定的算法人才,但不想花精力管理基础设施,而且迫切希望加速机器学习应用开发的企业。

过去一年,SageMaker就交付了50多项新功能。在今年的re:Invent大会上,AWS再次发布9项新功能,这些新功能集中在数据处理和自动化两大方面。Gartner 称到2023年,40%的开发团队会使用自动化机器学习服务来构建为其应用软件添加AI功能的模型,而2019年这一比例不到2%。

数据特征提取器Data Wrangler和数据特征存储库Feature Store,分别解决加速和简化数据准备,以及高效管理机器学习特征的痛点。Pipelines是第一个专为机器学习构建的、方便易用的CI/CD(持续集成和持续交付)服务。Clarify可以识别模型预测过程中的偏差。Deep Profiling for Amazon SageMaker Debugger可以自动监控系统资源利用率。Distributed Training通过自动剖析、识别分割模型,可以进行大型复杂深度学习模型的分布式训练。

最上层是即拿即用的AI服务,目前已经涵盖机器视觉、语音文字转换、机器对话、文本处理、电商业务、客服、企业内信息搜索、开发与运维、工业AI等方面。

赋能数据库开发者和数据分析师

今年,AWS将机器学习能力跟数据库进行嫁接,降低了数据库开发者和数据分析师应用机器学习的门槛。换句话说,数据库专业人才不需要专门学习复杂的机器学习模型构建,直接使用AWS的一系列内嵌机器学习能力的数据分析新服务,就能提高传统数据分析效率。

透过re:Invent大会,看AWS如何让机器学习扩圈?

譬如,针对著名的关系型数据库服务Amazon Aurora的用户,AWS推出了新功能Amazon Aurora ML。数据库开发者发起数据库查询(SQL)时,只要选择一个机器学习模型,就会唤醒机器学习服务,Aurora ML自动将查询结果交给机器学习模型进行推理,返回结果。

Amazon Athena支持直接从Amazon S3上的对象文件中,利用SQL语句进行数据查询(SQL是结构化查询语言,原本用于关系型数据查询,而S3的对象文件不是关系型数据)。

针对云原生数据仓库Amazon Redshift,AWS推出Amazon Redshift ML,通过与Amazon S3、Amazon SageMaker的Autopilot功能结合,Amazon Redshift ML可以自动进行数据清洗、模型训练。

Amazon QuickSight Q是一项更酷的功能,用户可以用自然语言对数据进行提问,几秒钟之内就可以得到高度准确的数据洞察结果,在传统方式下可能需要几天甚至几周时间。

开箱即用的工业领域机器学习解决方案

今年re:Invent大会上,AWS首次推出开箱即用的工业领域机器学习解决方案。目前包括Axis、凌华科技、BP、德勤、Fender芬达、GE 医疗和西门子交通等等行业领先企业都已经在使用这些方案。同样,针对有无传感器网络、有无工业摄像头等企业不同的工业互联网基础,AWS也推出了从软硬件系统、一体机到SDK的丰富选择。

Amazon Monitron面向没有建立传感器网络的企业,提供由传感器、网关和机器学习服务组成的端到端机器监控系统,检测异常并预测何时需要维护工业设备。

AWS Panorama一体机是一个硬件设备,将它连接到工业场所的网络中,它就可以自动识别摄像头数据流,与工业摄像头进行交互。同时,对于有工业摄像头布局的企业,AWS Panorama软件开发套件(SDK)可以让企业在硬件中嵌入计算机视觉功能。

Amazon Lookout for Vision为工业客户提供高精度、低成本的产品质量异常检测解决方案,其每小时可以处理数千张图像,从中发现产品缺陷和异常。

透过re:Invent大会,看AWS如何让机器学习扩圈?

2016年起,AWS就开始在云上提供机器学习服务。最近三年,在机器学习领域AWS每年新增的服务和功能超过200个。这一过程中,AWS机器学习的愿景始终没变过:把机器学习的能力交到每一位创建者手中。

AWS大中华区云服务产品管理总经理顾凡认为,AWS将持续为企业打造全面丰富的机器学习工具集,right tool for the right job(为每一项工作都提供一个趁手的工具),赋能每一位AI工作者。

本文为「智能进化论」原创作品。

智能进化论
专注云计算、AI、数字化转型领域深度报道。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)