每个人可能都想过这样一些问题:我们的地球,能够承载多少人口?地球上的石油和煤炭能用多久?碳排放的极限在哪里?
但你有没有想过,我们的地球,能够承载多少数据?
根据《数据存储2030白皮书》预测,到2030年,全球每年新产生的数据总量将超过1YB,也就是1亿亿亿字节。这个数据增长速率,已经远远超过了目前阶段全球存储容量的增长。根据相关数据,2022年全球前五名外置存储厂商发货容量是2012年的3倍,相对迎面而来的YB数据时代,这样的发展速率远远不够。
换言之,很可能有一天,我们的地球会面临数据太多,无法完成有效存储的可怕景象。那可能意味着生产力发展停滞、大量珍贵数据不得不被删除、人类文明的记忆开始褪色。
存储,就像人口问题、能源问题、环境问题一样,正在成为困扰地球未来发展的巨大挑战。
这也意味着,我们必须像直面环境与能源问题一样,去直面数据洪潮带来的压力。去透视问题的本质,寻找解决问题的思路,承担起彼此应该承担的责任。
5月23日,2023创新数据基础设施论坛在德国慕尼黑举办。本届论坛以“新应用、新数据、新韧性”为主题,来自全球的各界专家与产业代表共同就YB数据时代下的数据基础设施建设展开探讨。
会上,华为全面阐述了拥抱新兴应用生态、高效处理海量非结构化数据、全面提升数据韧性等数据存储产业演进方向。这些演进方向,可以看作是华为直面存储挑战的态度,也可以看作是各界对建设未来数据支点的尝试。
更可以看作是今天的存储产业,给地球上那些美丽数据的一个承诺。
仰望星空,脚踏数据
或许有朋友会觉得,数据存储无非就是数字化产业自己的问题,它跟地球发展有什么关系?
其实不然。伴随着千行百业的数字化、智能化,数据存储已经变成了每个行业、每个领域,甚至到每个人都必须面对的挑战。可以说,从科研到生产,从生活到艺术,每个领域都离不开存储。数据存储能力即是生产力,数据质量是发展质量,已经成为了今天各领域的普遍共性。
仰望星空,首先需要脚踏数据——在参加论坛的多位嘉宾分享中,我们能够清晰看到这一点。
比如说,人工智能是今天最火热的科技领域。但高速发展的人工智能技术,乃至于未来面向通用人工智能的发展轨迹,事实上都离不开存储的有效支持。一方面,人工智能将产生海量的非结构化数据,比如一辆自动驾驶测试车,每天就会产生几TB的数据量;另一方面,人工智能发展需要与存储以及其他ICT技术深度融合,最终才能让AI与数字化体系相互促进。图灵奖得主、Verimag实验室荣誉科研主任Joseph Sifakis教授就在分享中提出:目前,我们对于什么是智能以及如何实现通用人工智能(AGI)仍存在很多困惑。人工智能与信息通信技术的融合是弱人工智能向通用人工智能过渡的标志,同时这个过程使二者在融合中互相借鉴、优化,要实现融合,就需要填补由数据驱动的人工智能与基于模型的ICT之间的差距。
除了科研与技术发展,更多领域都有赖于先进数据存储的建设。比如,在自然环境保护这个关键领域,来自公益组织极地未来的创始人、理事长虎姣佼,与项目顾问、北极项目协调人Rigmor Kristin Johnsen分享了通过冰芯解读地球数据的实践。通过对冰川的解读、分析,可以探究地球环境的真实变化规律,为更好保护地球带来支持,而环境数据,尤其是经年累月的环境变迁数据,也会产生海量数据,考验着存储的承载能力与调用效率。为了更好地保护地球,数据存储必须做好准备。
类似的考验还发生在金融领域。金融行业是最典型的重数据、贵数据行业。如何提升金融行业的数据基础设施能力,是伴随产业发展的核心命题。EOS公司EWS负责人Thomas Willert、UnionDigital银行行长&CEO Henry Aguda、SabanciDx技术和云解决方案负责人Sahin KurtActon咨询有限公司、EkkoSense有限公司数据中心顾问Mark Acton分别就金融行业如何构建创新数据基础设施,数字银行演进,如何打造新一代创新方案,助力数字化转型以及数据中心的可持续发展等话题发表了自己的见解。
不难看出,来自全球科学、环境、金融等各个领域的代表,都看到了自身领域提升数据基础设施的重要性。这种共性需求一步步落实到存储产业中,就形成了面向YB时代存储行业的发展趋势与提升动力。
来自全球的呼唤,形成存储产业三大变革
YB时代的数据洪潮,以及来自全球各个行业、各个领域的数据存储建设需求,最终落脚点一定是存储产业本身的升级,想要更高效、妥善承担起责任,就需要找到存储发展的关键路径和关键方法。
在论坛中,华为提出了随着数字化转型深入,数据存储产业面对的巨大变革与发展机会。在其中我们就可以总结出,全球存储产业面向未来的三大变革方向。
一、拥抱新应用。
数据来自于应用,数据的存储效率、存储要求,也都与应用紧密相关。基于此,存储产业不能仅考虑加大生产,而是必须基于应用来思考和规划自身的产品,以此来让存储更加适配应用,产生1+1大于2的效果。
比如说,Joseph Sifakis教授讨论了AI与数据存储之间的关系,而这个关系也将在AI的产业化普及过程中,带给存储行业更加深远的影响。在今天,全球56%的企业都在部署AI应用,并且将有更多企业不断提升自己的AI应用部署深度与广度。而AI应用将带来多样化数据并行处理能力的高要求,甚至重构数据存储与数据应用之间的协同方式、分工模型,带来新的数据范式。如何能面向AI应用,提供更高性能、更高效率的存储产品,将成为存储行业发展的重心。
拥抱新应用,拥抱用户快速发展的使用需求与使用习惯,是存储产业发展的关键趋势。
二、应对海量非结构化数据
在今天,我们不仅在经历数据的爆发式增长,更在经历非结构化数据的飞速增加,这是过往存储产业未曾面对的新情况。根据相关统计,目前有80%新增的数据为非结构化数据,其年复合增长率达到38%。
随着行业智能化的加深和普及,非结构化数据将进入企业的生产核心与决策核心,这就需要不断提升非结构化数据的访问效率,进而导致分布式存储的读写带宽和IO访问效率必须进行数量级的提升。同时,分布式存储需要在软件、算法以及硬件方面通过系统性创新,满足海量非结构化数据对极致成本效益的要求。此外,数据规模的增长还需要存储具有更强的智能化水平,提升数据编织能力,实现全局化的数据管理与调度。
三、增强数据韧性。
当前,数据已经被明确定义为第五生产要素,其价值与重要性正在不断提升,这也导致数据必须像金钱、人才一样得到妥善的保护。但现实是,数据的韧性挑战还非常严峻,比如勒索病毒已经成为了威胁数据安全的全球化问题,勒索病毒变种多、演变快、给企业造成危害大的问题愈演愈烈。
为了应对这些数据安全挑战,企业必须提升存储本身的安全能力。将安全防护从系统、软件下放到存储本身,构成具有主动防御力与数据韧性的存储系统。在未来,勒索检测、数据加密、安全快照和AirGap隔离区恢复特征安全能力将内嵌到存储当中,让存储不再是数字化安全的软肋,而是变成数据安全的最后一道防线。
适配应用、提升能力、强化智能、增加安全,这些发展趋势将在未来很长一段时间内伴随着存储产业的发展。而先行一步的华为,已经将这些趋势凝固在自身的产品与解决方案中,率先给YB世界一个妥善无忧的存储承诺。
YB时代,给地球一个数据支点
面对来自全球各个领域的存储升级需求,以及明确的存储产业发展趋势。华为通过读懂这些需求和趋势,不断进行技术创新,并且取得了业界的良性回馈。
华为公司副总裁、数据存储产品线总裁周跃峰指出,华为数据存储携手客户与伙伴共同成长,提供丰富的产品与解决方案,其中OceanStor Dorado全闪存存储和OceanStor Pacific分布式存储均荣获2023 Gartner Peer Insights™“客户之选”。
据了解,2023 Gartner Peer Insights™“客户之选”当中,有业界主流的23家厂商入围参与了奖项评选,最终为华为OceanStor Dorado全闪存存储收到来自亚太、欧洲、中东等区域的数百个客户评价,覆盖运营商、金融、教育、医疗、能源、制造等行业,以100%的用户推荐度和5.0的总体评分在全球入围厂商中位列第一,体现了全球客户对华为OceanStor全闪存存储的充分肯定与持续信任。
能够取得这些成绩,正是因为华为不仅坚持了对存储大容量、高可靠、高性价比的探索,还积极将未来纳入此刻,将打造数据新范式、提供智能化的数据编织能力、内容的数据韧性等前沿技术体验带给客户,让客户不仅提升了存储容量,更加综合性、立体化地提升了应对未来的数据存储能力。
如今,华为存储不仅达成了中国领先,更已经在欧洲、亚太、中东全球市场证明了自己。在慕尼黑,我们可以看到华为来自全球的客户与伙伴对华为的认可,来自千行百业的信任,就是华为存储给未来的承诺,给地球的数据支点。