天极大咖秀

登录 | 申请注册

Dell PowerScale 成就AI就绪数据平台

郭涛 2024-03-14 阅读: 1,003 次
从AI语言模型ChatGPT到视频生成模型Sora,短短一年多的时间,AIGC在人们的工作和生活中掀起了巨大的波澜。在今年全国两会上,人工智能成为热点话题,“人工智能+”也首次被写入政府工作报告。最直接的理解,“人工智能+”就是要将人工智能与行业、场景紧密融合,加速其落地和推广应用。有统计数据显示,2023年,我国生成式人工智能的企业采用率已达到15%,市场规模约为14.4万亿元。由此可见,“人工智能+”的前景十分值得期待。

在企业的数智化转型过程中,“数”与“智”就像秤杆离不开秤砣。有人甚至这样说,“人工智能的本质就是数据”。为了更好地支撑人工智能落地,在算力方面已经我们谈了很多。如今,在全球范围内,英伟达股票的涨跌已经成了整个智算行业的风向标。那么在存力,也就是数据准备、供给方面,我们的企业又做得如何呢?有没有行之有效的应对之策呢?

Dell PowerScale与时俱进,致力于为行业用户提供理想的AI就绪数据平台,加速AI的落地与创新。Dell PowerScale究竟是如何做到的呢?

AI时代 PowerScale与时俱进

近日,戴尔科技推出了适用于全闪存产品的两个新节点——Dell PowerScale F210和F710。戴尔科技将领先的PowerEdge服务器硬件平台创新,与OneFS软件的创新完美融合,打造出最新一代高性能文件存储系统PowerScale,它具有更加卓越的性能和效率,以及极高的安全性和多云敏捷性,为AI提供了高效、可靠、就绪的数据平台。

“多年以来,戴尔科技持续地进行存储技术创新,并推动整个生态共同构建全面解决方案,以满足不断变化的企业工作负载的需求。”戴尔科技集团大中华区存储产品部产品经理岑广海将戴尔科技的存储“内核”概括为三点:降本增效、创新、生态。而PowerScale就是具体的体现之一。

综合来看,Dell PowerScale具有出色的灵活性、安全性和高效的文件存储能力。从性能上看,在软件进一步优化的情况下,PowerScale的流式读取性能较上一代产品提高两倍,显著加快了向GPU馈送数据进行模型训练和微调的速度; 同时,流式写入性能提高一倍,可优化AI工作流程的模型训练和推理阶段的检查点功能;有效降低延迟,在面对高并发和延迟敏感型工作负载时,如高频交易(HFT)和电子设计自动化(EDA),可实现最高2.6倍的性能提升。

从效率上看,最新的PowerScale采用了Smart Flow机箱,使气流的流动变得更加合理,可以将适量的空气引导至需要的地方,从而提高能效。得益于这些持续不断的创新,戴尔科技在短短一年之内将每瓦性能提高了90%。

另外,在容量和密度上,PowerScale也有显著提升。PowerScale F710在1U配置中最多可容纳10块硬盘,与F600相比,节点密度提高25%;在引入15TB QLC硬盘后,PowerScale F210的容量比F200提升了一倍。

支撑AI应用的全生命周期管理,不是只要有GPU服务器就万事大吉了,如何对元数据进行提取、清理,直至训练、调优、推理,同样非常重要。这就对存储的性能和效率提出了更高的要求。如上所述,PowerScale提升的重点也是在这些方面,从容量到密度,从性能到效率,从安全性到绿色环保,一个也不能少。

“为了更好地满足AI应用的需求,单纯硬件的创新和提升是远远不够的,必须还要有软件的协同和同步改进。”岑广海强调说,“OneFS是业界领先的横向扩展文件系统,其优势主要体现在高性能、高安全性、高效率,以及对多云的支持和简化管理上。目前,OneFS最新的版本已经达到9.7。”

“软件驱动存储创新”对于戴尔科技来说并不是什么新鲜事,而是多年来始终坚守的一条准则。戴尔科技集团大中华区信息基础架构解决方案事业部存储业务总经理刘志洪表示,软件定义一定是未来的方向。近几年,随着软件定义架构的硬件越来越成熟,戴尔科技可以更充分地发挥自己在标准硬件上的突破技术和软件创新的能力。去年,戴尔科技发布的2000多项新功能都是软件方面的创新。今年上半年,戴尔科技存储的更新也主要集中在软件层面。

软硬均衡的PowerScale已连续八年蝉联Gartner分布式文件系统和对象存储魔力象限的领导者。如今,PowerScale F210与PowerScale F710的推出,更凸显了PowerScale在性能与效率上“高人一筹”的能力。PowerScale F210是同时满足高性能和小容量要求的最佳平台,而PowerScale F710则完美实现了高性能与大容量的平衡,面对不同的客户和业务需求,降本增效手到擒来。

实际上,PowerScale不仅能够为AI提供就绪的数据平台,支撑传统工作负载,比如EDA、媒体娱乐、高频交易、大数据分析等,同样游刃有余。

整个数据生态都要Ready for AI

近日,戴尔科技刚刚公布了最新财报,其2024财年全年营收达到884亿美元,运营利润为52亿美元。戴尔科技集团大中华区存储产品部总监范圣俭解释说,集团在不断提升运营利润的同时,其站在AI风口上的产品研发也得到了广大用户的认可。

在AI方面,PowerScale与英伟达一直携手并进。据统计,目前,已有超过1500家客户在戴尔科技UDS上运行GPU工作负载。PowerScale正在进行NVIDIA DGX SuperPOD的验证,能够为AI数据传输提供强大动力,提高AI建模和推理的便利性。戴尔科技集团大中华区非结构化数据存储事业部产品经理李海表示,与其他也通过了NVIDIA DGX SuperPOD认证的厂家不同,戴尔科技在产品认证上是两条腿走路:一条腿是基于InfiniBand,另一条腿是基于以太网。目前在以太网方面,戴尔科技已经可以支持800GB,接下来就是1.6T。开放、经济、普适的以太网将是主流的支持AI的后端网络架构。

特别值得一提的是,包括新发布的PowerScale F210与PowerScale F710在内,戴尓科技最新的、全线的全闪产品,都通过了英伟达平台的认证。用户总是希望采用最新的系统来支持最新的模型、最快的GPU。经过验证的戴尔科技存储产品已经准备就绪。

“我们的认证是全方位的,不仅仅是硬件产品,还包括软件层面、服务层面,这也是差异化所在。”李海强调说,“我们全球的研发团队,包括上海、北京的研发团队,都有专门的数据和科学家团队。他们与英伟达的团队密切配合,在英伟达CUDA平台上保持良好互动,帮助用户解决从模型到应用、从训练到推理再到交付的相关问题,从而加速AI落地。”

刘志洪补充说:“除了全面、专业的认证以外,戴尔科技的存储还是最容易管理、最容易使用的,这也是得到用户充分认可的。”总之,采用戴尔科技的存储和方法,保证了开放性,能够有效实现整个生命周期中数据的上传和下载,达到降本增效的目的。

AI时代,数据管理变得更加重要。因此在过去一年中,戴尔科技除了持续进行产品更新以外,还有一项重要举措,就是与许多行业领先的数据管理公司进行合作,推出了数据湖仓一体解决方案,更好地适应信息生命管理新的形态变化。“对于用户来说,需要的是完整的生态系统,而不是一个单独的AI产品。在数智化时代,整个生态系统要Ready for AI。”范圣俭如是说。

软件驱动创新

毋庸置疑,存储就是为数据服务的。更进一步,存储要为任意的数据、任意规模的数据提供强大的支撑。随着生成式AI的兴起,越来越多的数据是由机器生成的,甚至是机器根据机器生成的数据再加工而成。这些数据如何存储、如何管理?刘志洪表示,戴尔科技希望帮助企业用户在应用人工智能、大数据分析的过程中更顺畅地挖掘更多价值。

在不断变化、注重安全的多云世界里,戴尔科技将通过软件驱动的创新,为用户提供持续优化的存储体验,以提升效率,强化安全,提供多云的灵活性,更从容地应对不可预知的IT挑战。

从PowerScale存储演进的过程中我们可以发现,在持续优化硬件的同时,更重要的是驱动软件的创新,这不仅是戴尔科技存储的愿景,更是用户的需求。

郭涛
以“云”为基,以“数”为魂,以“智”为道,新IT,新经济。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)