AI是什么?一种应用,还是一种技术?
时至今日,当AI越来越多落地的时候,AI更像是一种能力,一种渗透到各个行业各个场景、实现智能化应用的能力。
当AI进入“能力时代”之后,其“三件套”(数据、算法、算力)中,算法越来越重要了,因为它是把数据变成业务决策的核心要素。一个好的算法模型的产生,离不开机器学习。
显然,AI开发者需要一个好用又强大的机器学习平台。这个领域的领导者Amazon SageMaker,最近刚刚在中国的宁夏和北京区域落地,而且带来了其最新的集成开发环境Amazon SageMaker Studio,以及一系列最新的开发调试工具。
现在AI很火,其实AWS自己很少谈论AI这个名词,他们更多地是谈论具体的机器学习应用和服务。
不过,为了让大家有更多的了解,在讨论AWS机器学习服务Amazon SageMaker之前,我们先来看看AWS的机器学习服务家族。
AWS的机器学习服务分为三层,与云服务的三层架构基本一致。
底层是基础层,即机器学习框架和基础架构,包括GPU、FPGA、容器等等。
中间层是平台层,面向开发者、数据科学家、数据工程师(AWS把他们叫做Builder)的机器学习开发平台Amazon SageMaker,也就是今天讨论的重点。这不是一个简单的服务,包括了众多的工具或功能。
上层是应用层,是各种可以直接调用的AI应用。比如文字翻译、语音识别、视频分析,甚至还有金融欺诈探测器这样的炫酷应用。
所有这些都是以云服务的方式提供给开发者和最终用户的,在方便使用的同时,更开启了无限可能,使AI作为一种能力深入到各行各业。
AWS中国首席云计算企业战略顾问张侠博士介绍说,机器学习带来的AI能力正在影响很多行业。比如媒体娱乐业的内容分类和字幕自动生成,健康医疗业的辅助诊断和药物发现,电商行业的个性化推荐和营销工具,金融行业的风险管理和潜在客户发现等等。
这些广泛的AI应用正在成为企业数字化转型的重要驱动力,在提升企业竞争力的同时,也推动了数字产业的发展和国家经济的产业升级。
机器学习的实施是一项非常复杂的工作,涉及大量试错,并且需要专业技能。开发者和数据科学家首先必须对数据进行可视化、转换和预处理,这些数据才能变成算法可以使用的格式,用以训练模型。即使是简单的模型,企业也需要花费庞大的算力、大量的训练时间、很多的专业人才。
张侠认为,三大因素在制约机器学习的进一步广泛应用:掌握AI专业知识的人才不多、构建和扩展AI的技术产品有难度、在生产经营中部署AI应用费时且昂贵,因此市场呼唤一个成本低、易使用、可扩展的AI产品和服务。
Amazon SageMaker就是为此诞生的。它是一种完全托管的机器学习服务,使得开发者能够轻松地将基于机器学习的模型构建到智能应用程序的生产实践中。
为了开发者能够更轻松地构建、训练、解释、检查、监视、调试和运行机器学习模型,AWS前不久刚刚发布了Amazon SageMaker Studio。这一功能此次也在中国的两个区域落地,成为其全球最早部署的几个区域之一,排在第五和第六。
Amazon SageMaker Studio是一个面向机器学习的集成开发环境(IDE),将所有用于机器学习的组件集中在一个地方。
与我们常见的软件开发IDE一样,开发者可以在Amazon SageMaker Studio中查看和组织源代码、依赖项、文档和其它应用程序资产。与传统的软件开发IDE不一样的是,其无需购买软件许可,而是像云服务一样按使用时长付费。
如今的机器学习工作流有大量组件,许多组件都带有各自的一组工具。Amazon SageMaker Studio IDE为所有Amazon SageMaker功能和整个机器学习工作流提供了一个统一界面,为开发者提供了创建项目文件夹、组织Notebook和数据集,以及协作讨论Notebook和结果的功能。
简化,是整个Amazon SageMaker的设计理念,这给客户带来了很大的价值。
“Amazon SageMaker极大简化了机器学习系统的构建、训练和部署流程,使我们无需再构建基础设施。通过其内置算法,只需要准备数据,仅用三个月时间就完成了整个系统的建设,实现了从0到1的突破。与自主构建模型相比,通过训练阶段使用ECS 的Spot Instance(竞价实例),能够节省70%的费用”。
做出如此评价的是大宇无限机器学习技术总监苏映滨。大宇无限是脱胎于豌豆荚的一家移动应用开发公司,旗下拥有Snaptube和Zapee等国际流行的短视频移动应用。在基于AWS技术建立短视频服务的同时,大宇无限也在使用机器学习系统做短视频推荐功能。要实现短视频内容在线推荐,对其开发团队是一个巨大挑战,流程复杂,要投入很多人力和时间。而通过采用Amazon SageMaker,其实现了高达70%的成本节省。
为了进一步帮助开发者降低开发难度、节省开发时间,AWS此次还为Amazon SageMaker推出了很多新的功能。
Amazon SageMaker Notebooks提供了一键启用的Jupyter Notebook,具有秒级的弹性计算提升能力;Amazon SageMaker Experiments可以帮助开发者组织和跟踪机器学习模型的迭代;Amazon SageMaker Debugger用于调试和分析模型训练,提高准确性,减少训练时间,让开发者更好地理解模型;Amazon SageMaker Autopilot是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能;Amazon SageMaker Model Monitor允许开发者检测和纠正概念漂移……
这些功能也都被集成在Amazon SageMaker Studio,开发者可以方便地按需调用。
今年二月,Gartner发布了《云AI开发者服务魔力象限》,AWS被列入领导者象限,并且在前瞻性和执行力两个维度都名列前茅。
据了解,此次AWS被Gartner评为领导者,主要是因为其推出的自动生成机器学习模型工具Amazon SageMaker AutoPilot受到了广泛好评。这一工具可根据用户的数据自动训练和调整最佳机器学习模型,降低了机器学习的开发门槛。
Amazon SageMaker Autopilot会自动检查原始数据,应用特征处理器,挑选最佳算法集,训练多个模型,对它们进行调优,跟踪其性能,然后根据性能对模型进行排名。点击几下鼠标,用户可以得到用于部署的、性能最佳的模型推荐,只需很少一点时间和精力用于训练。
Amazon SageMaker Autopilot为开发者提供了50种不同的模型。缺乏机器学习经验的人可以轻松地生成仅基于数据的模型,经验丰富的开发者可以使用它快速开发基础模型,团队可以在此基础上进行进一步迭代。
值得注意的是,AWS在国内的AI研究团队也为Amazon SageMaker做出了贡献。其DGL图神经网络框架是由AWS上海人工智能研究院开发的一个开源代码库,旨在简化图神经网络的实现和部署。
领先的产品和服务,要获得用户的青睐,也离不开合作伙伴的支持。
伊克罗德是一家云原生咨询服务公司,也是专注于AWS的核心合作伙伴。伊克罗德产品经理陈昶佑介绍说,在帮助用户用好Amazon SageMaker的同时,伊克罗德也在把Amazon SageMaker用于构建自己的行业解决方案,为客户打造真正解决商业问题的AI应用。
AWS的机器学习服务还能够与AWS其他云服务无缝整合,形成完整的应用方案。陈昶佑说,伊克罗德正在协助客户加速商业创新,既推广Amazon SageMaker平台,也利用伊克罗德的行业经验将AWS的SaaS应用快速落地,使行业客户对AI应用唾手可得。