伴随着人工智能应用走向行业细分场景,机器学习越来越受到关注。
从IT厂商层面来看,大家都在积极推出机器学习的相关产品和服务,并推动合作伙伴进入该业务领域;从行业用户层面来看,越来越多的企业都在考虑如何利用机器学习来改善业务流程,提升运营效率,其中很多已经付诸实践。
在今年的亚马逊re:Invent上,AWS专门安排了一个机器学习专题的主题演讲,这无疑表明了其对这一业务的重视程度。的确,在过去一年里,AWS推出了非常多的与人工智能和机器学习相关的服务和功能,并且在超过10万名客户处得到了应用。
我们从AWS全球负责机器学习的副总裁Swami Sivasubramanian的主题演讲,以及AWS大中华区云服务产品管理总经理顾凡的介绍中,可以对AWS的相关业务有一个全面的了解。
AWS在AI和机器学习方面的业务,始于2016年。当年,AWS仅推出了三个AI的SaaS应用。2017年开始加速,新服务和新功能达到了60项。
而在过去三年里,AWS每年新增的人工智能和机器学习的新服务和新功能,都超过200项。
顾凡介绍说,AWS在服务客户的过程中,始终坚持两个原则。
一是“授人以鱼不如授人以渔”,希望帮助客户建立起机器学习的能力,因此一直在为客户提供机器学习工具,并教会大家使用这个工具。二是“扶上马再送一程”,当客户无法自己搞定时,AWS会出手帮大家,通过自己的工程师专家团队与客户的行业专家团队合作,开发出产品原型,从而快速帮助客户解决业务难题。
正是按照这个原则,AWS形成了业界最全面也最深入的人工智能和机器学习业务布局,为各行各业提供服务。
在中国,AWS的相关服务已经在制造、医疗、出行、媒体、互联网等多个行业交付运行。顾凡介绍说,由于拥有丰富的数据资源和应用场景,外加政府政策的大力支持,中国已经成为人工智能领域发展最快的国家之一。
我们都知道云服务可以分为IaaS、PaaS和SaaS三层,分别对应着基础架构、开发平台和软件应用。AWS的人工智能和机器学习业务同样可以分为这三层。
上图是AWS目前的人工智能和机器学习业务全家福。
最底层是机器学习框架和基础设施。与算力相关的部分都在这个层面,包括GPU和FPGA等,为上层应用提供了算力支持。
中间层是机器学习服务,即AWS过去一年在力推的Amazon SageMaker服务。其相关功能都被放在一个叫做SageMaker Studio的集成开发环境里,面向行业用户的数据工程师和行业专家,为他们提供一个完整的机器学习开发工具,根据自己的业务需要来进行模型训练。
最上层则是可以随时调用的SaaS服务,用户可以直接通过API来使用这些服务,无需自己开发模型。比如语义理解、机器翻译、文本语音相互转换等等。除了这些常见的AI服务,亚马逊还提供了一些与行业细分场景紧密相关的服务,比如欺诈检测,就是利用其在电商行业的经验开发出来的。
在IaaS、PaaS、SaaS三个不同的层面,AWS都在不断地完善和丰富产品线。
在上述业务架构中,处于中间层的Amazon SageMaker服务,无疑是核心。
相比而言,底层的只是基础架构,离业务和应用尚远;顶层的SaaS虽然贴近应用,但只能是通用服务,无法满足行业用户的各种需求。而Amazon SageMaker则可以为各个行业用户来构建、训练和部署机器学习模型,从而带来丰富的定制化应用。
因此,Amazon SageMaker也是过去三年来AWS的发力重点。在过去一年,AWS已经交付了 50 多项 Amazon SageMaker 的新功能。在re:Invent的主题演讲中,Swami则重点介绍了九项Amazon SageMaker的最新功能。从这些新功能中,我们能够看清AWS的发力方向所在。
这些新功能包括:Amazon SageMaker Data Wrangler,为机器学习数据准备提供了快速、简便的工具;Amazon SageMaker Feature Store,存储和管理机器学习特征;Amazon SageMaker Pipelines,实现工作流管理和自动化;Amazon SageMaker Clarify,进行偏差检测和模型解释;Deep Profiling for Amazon SageMaker Debugger,进行模型训练剖析;Distributed Training on Amazon SageMaker,缩短模型训练时间;Amazon SageMaker Edge Manager,管理边缘设备模型;Amazon SageMaker JumpStart,帮助新开发者开启机器学习之旅。
可以看出,上述新功能包括更易用的数据预处理、专用的特征存储、自动化工作流、更多的训练数据可见性以减少数据倾斜和更好的预测解释、大型模型的分布式训练速度可最多提升两倍,以及监控边缘设备上的模型等。
这些新功能所带来的最大益处是,可以降低机器学习的开发门槛,让新开发者也能够快速地创建、训练、调优和部署机器学习模型,从而使得人工智能能够在更多的行业细分场景中实现应用落地。