天极大咖秀

登录 | 申请注册

从HPC到HPDA,华为OceanStor Pacific让气象预报更精确

丁常彦 2021-07-01 阅读: 6,712 次

“朝霞不出门,晚霞行千里”,“八月十五云遮月,正月十五雪打灯”,这些我们耳熟能详的气象谚语,是古人在日常生活与生产中总结出来的最原始的“天气预报”。

在过去的一百年间,天气预报逐渐从一项基于经验的推测和总结,逐渐演化成利用科技手段,不断提升预报准确性的高科技产业。尤其在近年来,高性能计算(HPC)、大数据、人工智能等新技术的普及,天气预报的时间、地点都变得越来越精准。

过去,由于天气预报涉及海量数据的计算,算力在很大程度上是提升天气预报精确性的瓶颈;如今,随着HPC、大数据、人工智能的日趋融合,算力瓶颈已经被打破,高性能计算的重心开始从以计算为核心,向以数据为核心的计算演进,高性能数据分析(HPDA)逐渐成为气象预测新的发力点。

于是,华为OceanStor Pacific系列下一代高性能数据分析(HPDA)存储应运而生,从而帮助气象预测部门更高效地应对HPC产业向数据密集型升级所带来的挑战。

日前,权威独立测评机构ESG实验室对该产品的评测显示,华为OceanStor Pacific可为超大数据集提供持续的高性能并充分支持以数据为中心的实际应用;而且,相对于传统横向扩展NAS系统而言,部署华为OceanStor Pacific 可以帮助企业降低存储TCO高达61%,同时提高可用性并减少运营工作量。

作为美国著名IT咨询机构,ESG(Enterprise Strategy Group,企业战略集团)专注于 IT 分析、研究、验证,尤其以实验室测评的独立、严谨和实用著称。

HPDA取代传统HPC,让“天有可测风云”

去年,来自中国气象局披露的数据显示,在准确率上,我国天气预报的晴雨预报准确率已经达到88%,而2004年的准确率只有近80%;在精细度上,1998年中国区域分辨率为50公里,现在中国区域分辨率已经精细到3公里。

这一成绩的取得,与HPC等新技术的应用密不可分。目前,气象预测过程主要包括数据采集、数据同化、集成预测和气象展现四个阶段,其中,在数据同化过程中,就是要将采集到的观测数据通过高速通信网络传输到HPC中,通过求解描写天气演变的方程组,来实现对未来天气的预测。

由于这是一组涉及到物理学和流体力学的复杂方程组,只有超算强大的数据处理和高速运算,才能够在短时间内执行这一工作。因此,在过去数十年间,HPC发展的核心在于解决气象预测中的计算问题。

随着新的高性能计算应用不断涌现,尤其是多样性算力的涌现,算力越来越充足,数据价值也能够被更充分地挖掘。但与此同时,随着数据量的爆发式增长,以及数据重要性也越来越高,割裂的数据分析机制,正在成为制约数据变现的主要瓶颈。

HPDA和AI-based的HPC等数据密集型HPC,逐渐成为HPC产业发展的新趋势。对此,华为公司也认为,未来,加快数据密集型超算的建设会成为主要方向,包括从超算向智算平台演进,用人工智能、大数据等新应用生态加持超算中心,实现以数据为中心牵引采、存、算、传、用等多维度的均衡发展。

如果说过去HPC的应用实现了气象预测“从粗到细”的转变,那么如今HPDA的应用则有望实现气象预测“从细到精”的转变。

向HPDA加速演进,华为存储全新升级

HPDA的大行其道,使得存储作为数据的承载者,逐步成为推动高性能计算产业发展的新动能。具体来说,HPDA给海量存储带来的新需求主要体现在以下三个层面:

首先,数据量从PB级向EB级的演进,使得存储成本日益增高,如何借助高密、高效冗余、热温冷分级、重删压缩等技术降低存储成本成为刚需;其次,计算量的持续增加,对海量数据的存储能力提出了更高要求,传统存储已经难以满足需求;第三,应用的多样化已经给数据分析提出了新要求,存储必须能够更高效地支持数据的频繁迁移和转换。

来自ESG实验室的调查表明,21%的企业报告称其管理的数据超过10PB,5%的企业管理的数据超过50PB。数据量的爆炸式增长使数据管理、安全存储、安全分析和业务洞察变得异常困难。此外,71%的企业表示,数据存储技术具备战略意义,对其核心应用和业务流程至关重要,可以打造竞争优势。

当前,随着监测更加精密化和多源数据广泛汇集,气象部门数据持续爆炸式增长。初步预计,部门内外气象数据到2022年将达到45PB,日增量40TB。因此,气象部门一直在寻求如何更高效地构建存储基础架构,以应对大量结构化和非结构化数据的生成、收集和分析。同时,气象部门也在使用数据密集型应用,如AI/ML、财务建模、业务数据分析、后期制作编辑和物联网(IoT)等使用多种协议访问非结构化数据的应用。

气象部门对新型存储解决方案的呼声越来越高,它不仅要能够为数据读取提供快速稳定性能以及为多应用提供元数据操作,还要能够有效应对数据、存储快速增长,高效处理海量数据、应用需求,从而使数据价值最大化。

为此,华为推出了OceanStor Pacific系列下一代高性能数据分析(HPDA)存储,以超高密设计、面向混合负载、多协议互通,全面加速HPC向数据密集型演进。目前,该产品已经成功应用于气象预测、卫星遥感等高性能计算场景中。

打造下一代HPDA存储,华为OceanStor Pacific凸显三大特性

在高性能计算领域,HPDA并不是一个新概念。早在2014年,分析机构IDC就在一份名为《全球高性能数据分析存储2014至2018预测》报告中预测:在报告期内,HDPA存储产品销售额将从2013年的5.14亿美元,以26.5%的年复合增长率持续快速增长。

去年6月,来自Hyperion Research发布的HPC市场研究报告也表明,从2019年至2024年,HPC存储将成为HPC市场中增长最快的部分。面对市场的快速增长,主流存储厂商都在聚焦大数据分析和人工智能场景,通过收购或技术创新不断提升HPC存储性能。

华为OceanStor Pacific系列下一代高性能数据分析(HPDA)存储的推出,无疑给HPC/HPDA市场带来了新期待。为了进一步验证OceanStor Pacific的性能、可靠性、数据管理和总体拥有成本(TCO),权威独立测评机构ESG实验室对该产品进行了全方位实测和验证。

在多协议支持上,华为OceanStor Pacific的多协议互通能力允许应用通过多个协议共享一份数据,ESG在多协议测试环境中分析了OceanStor Pacific,验证了语义完整性、存储性能和高级功能,如快照、配额、QoS、对象存储多版本和对象多版本,并确认该产品可以实现跨文件和对象协议的持续无损高性能。

对于气象部门来说,多协议互通可以让数据自由流动,从而实现统一存储资源管理。这不仅让不同系统可以共享存储,还可以通过集约化降低存储成本,避免重复建设多套系统,全面发掘既有数据的潜在价值。

在混合负载测试上,华为OceanStor Pacific文件系统采用元数据分布、大小 I/O分流、磁盘索引等技术,可同时满足高带宽和高IOPS需求。ESG基于华为分布式并行客户端(Distributed Parallel Client,DPC)测试了华为OceanStor Pacific并行文件系统的性能,充分证明了该产品的这一特性。

气象数据处理需要高带宽,而对已处理数据的解释则需要高IOPS;尤其是大数据和人工智能技术的应用,正在让这一需求进一步凸显。而华为OceanStor Pacific混合负载测试表明,该产品可充分满足气象数据处理需要。

在高密设计和TCO上,ESG对部署横向扩展NAS系统和华为OceanStor Pacific 9550高密系统时的预估存储成本进行了建模和比较发现,华为OceanStor Pacific的五年TCO比高密横向扩展NAS系统低61%;由于OceanStor Pacific提供极高密度的平台,可最大节省64%的托管成本,62%的资本支出和32%的供电和冷却成本。

近年来,气象部门数据量的爆炸式增长,使得存储购买、维护、供电和冷却成本持续上升,兼具高密设计和较低TCO的华为OceanStor Pacific无疑是存储升级的优先选择。

如今,气象预测正在成为一种基础服务,为各行各业的运转提供重要依据。而华为OceanStor Pacific系列下一代高性能数据分析(HPDA)存储的推出,不仅可以推动HPC产业升级,还可以让气象预测效率更高、性能更佳、成本更优,全面释放HPC的应用价值。

丁常彦
科技领域资深新媒体,关注TMT。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)