天极大咖秀

登录 | 申请注册

如何加速生成式AI创新?用好这个工具很关键

趣味科技 2025-04-14 阅读: 2,449 次

俗话说“工欲善其事,必先利其器”,要想多快好省地加速生成式AI创新,企业应该学会如何善用新一代Amazon SageMaker。

无缝衔接的统一平台

伴随着人工智能技术的飞速发展,在数字化转型的大潮中,广大企业对于高效、集成的数据处理分析以及AI解决方案的需求也日益水涨船高。

为了满足企业客户的迫切需求,在2024 re:Invent全球大会上,亚马逊云科技推出了新一代Amazon SageMaker,旨在为企业提供从数据准备、模型训练到部署的全链路解决方案,其中核心的Amazon SageMaker Unified Studio近日已宣布正式可用(GA)。

亚马逊云科技大中华区数据分析与生成式AI产品总监崔玮指出,新一代Amazon SageMaker是亚马逊云科技在AI与数据分析领域的一次重大创新,它整合了数据湖、数仓、机器学习模型训练与部署等多个关键环节,构建了一个无缝衔接的统一平台。这一平台的推出,标志着亚马逊云科技在帮助企业加速AI创新、提升数据分析效率方面迈出了坚实的一步。

“随着生成式AI话题的日益盛行,企业客户逐渐意识到私有数据是其核心竞争力的关键体现。然而,随着业务的复杂化和技术的不断迭代,企业面临着工具集繁多、数据分散、权限管理复杂等挑战。新一代Amazon SageMaker正是为了解决这些问题而生,它提供了一个统一的数据和AI开发环境,让用户能够轻松访问和处理企业数据,加速产品迭代和创新。”崔玮表示。

统一开发环境的核心

据崔玮介绍,作为新一代Amazon SageMaker的核心组件,Amazon SageMaker Unified Studio是一个集数据准备、SQL分析、模型开发、模型训练、生成式AI应用开发等功能于一体的统一开发环境。用户可以在这个平台上发现和访问企业的数据,并使用最适合的工具处理几乎所有的应用场景。

Amazon SageMaker Unified Studio集成了多种数据处理和分析工具,包括Amazon Redshift、Amazon EMR、Amazon Glue等,用户无需在不同工具之间频繁切换,即可完成从数据准备到模型部署的全流程工作。除此以外,该平台还支持自然语言交互,用户可以通过问答形式完成数据探索和代码生成,大大降低了使用门槛。

通过Amazon SageMaker Unified Studio,开发者可以选择项目组并访问自己的数据集,能够使用Athena等数据处理引擎进行数据查询和处理,并利用Amazon Q生成代码,实现数据分析和可视化,极大地提升应用开发效率。

崔玮指出,新一代Amazon SageMaker并非是对传统工具的全面取代,而是在传统工具的基础上提供了一个更加统一和高效的开发环境。用户仍然可以根据自己的需求选择使用不同的工具进行数据处理和分析。与此同时,通过集成传统工具的功能和优势,新一代Amazon SageMaker还能够为用户提供更加全面和强大的解决方案。通过集成多种数据处理和分析工具以及提供自然语言交互能力,新一代Amazon SageMaker显著提升了用户的开发效率。用户无需在不同工具之间频繁切换即可完成全流程工作,极大地降低了使用门槛和时间成本。

数据治理与安全合规

在数据治理方面,Amazon SageMaker Unified Studio内置了Amazon SageMaker Catalog。这是一个端到端的数据AI治理平台,通过Amazon SageMaker Catalog,企业可以发布和管理数据资产,实现不同角色和项目之间的权限分工。

与此同时,Amazon SageMaker Catalog还提供了血缘数据和质量管理能力,能够帮助企业追溯数据来源和质量问题。

“Amazon SageMaker Catalog作为端到端的数据AI治理平台,为企业提供了全面的数据资产管理和权限控制能力。通过Catalog,企业可以轻松实现数据的发布、订阅和管理,并保障数据的安全和合规性。”崔玮表示,“数据治理是企业数字化转型中不可或缺的一环。Amazon SageMaker Catalog通过统一的平台管理数据资产和权限,不仅提升了数据访问的便捷性,还保障了企业的数据安全和合规性。”

打破数据孤岛实现跨数据源访问

针对企业数据分散存储在不同工具和环境中的问题,Amazon SageMaker Unified Studio通过Amazon SageMaker Lakehouse实现了跨数仓和数据湖的统一访问。Lakehouse采用Iceberg API作为开放的数据访问格式,支持用户通过统一界面访问存储在不同位置的数据。

除此以外,Amazon SageMaker Unified Studio还支持Zero-ETL功能,用户可以直接访问第三方数据源而无需进行复杂的数据转换和移动。这一功能不仅降低了数据处理的成本和时间消耗,而且还提高了数据的可用性和安全性。

崔玮指出,Amazon SageMaker Lakehouse通过Iceberg API实现了跨数仓和数据湖的统一访问。这不仅提高了数据的可用性和安全性,而且还降低了数据处理的成本和时间消耗。此外,Amazon SageMaker Unified Studio对Zero-ETL功能的支持,也进一步提升了用户访问第三方数据源的便利性。

来自汽车客户的现身说法

作为新一代Amazon SageMaker的成功应用案例之一,丰田汽车通过部署新一代Amazon SageMaker,成功解决了不同业务团队之间的数据分享、管理和搜索问题。

据崔玮介绍,通过亚马逊云科技提供的Amazon SageMaker Unified Studio,丰田汽车构建了一个高效的数据管理和分析平台,实现了数据的集中管理和访问控制,不同业务团队可以在平台上共享数据资源并进行协同工作,极大地提升了工作效率。与此同时,丰田汽车还通过生成式AI能力的应用,实现了提前预警和排查质量问题,从而能够更加快速地优化产品质量和对市场变化作出响应。

崔玮表示,新一代Amazon SageMaker具备统一的数据和AI开发环境,以及全面的数据治理和安全保障能力,旨在帮助企业加速数字化转型和创新步伐,同时也是亚马逊云科技在AI与数据分析领域的一次重大创新。随着生成式AI技术的不断发展以及企业数字化转型的不断深入,亚马逊云科技相信新一代Amazon SageMaker将在未来发挥更加重要的作用,为企业创造更多的价值。与此同时,亚马逊云科技也将继续关注市场需求和技术发展趋势,不断迭代和优化产品功能和服务水平。

趣味科技
年度十大媒体人,十佳科技自媒体,美通社媒体传播专家

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)