非结构化数据:一座未开发的金矿
伴随着云计算、大数据、物联网、人工智能等新兴技术的快速发展,各种智能终端设备飞速增加,全球数据也呈现出了几何级数的增长。来自国际数据公司IDC的统计显示,全球有将近90%的数据都是在近几年内产生。预测到2025年,全球数据总量将达到175ZB。其中企业存储的数据量,将超过全球总数据量的80%。
而在企业的存储系统中,体积最为庞大的就是非结构化数据——其在数据总量中的比例竟然高达80%-90%。从电信行业的话单,到金融行业的“双录”,从教育行业的教学文档,到医疗行业的影像资料,再到传媒行业的音视频素材……几乎所有类型的企业都需要长期存放大量的非结构化数据,这也导致其在数据总量中的比例一直居高不下。
可以想见的是,存储和管理数量如此庞大的非结构化数据,对于许多企业来说都是一项不轻的负担。如果对数据的存储和管理不当,不仅未必能够为企业带来理想的价值,企业还有可能因此蒙受巨大损失。不过从另一个方面来看的话,体量如此惊人的非结构化数据,如果管理和应用得当的话,对企业来说则是一座诱人的富饶金矿。
举例来说,2020年肆虐全球的新冠疫情,就给医疗行业带来了极其严峻的挑战。作为疫情检测的一种手段,医院需要为病人拍摄很多胸片,这时候医疗影像资料的存储和分析就显得尤为关键。如果医院有一个连续的机制将相关的影像数据存储下来,而且有连贯性地进行诊断,就可以通过病情的变化对其进行分析研究,并有的放矢地制定相应的治疗方案。
正因为如此,如何降低海量非结构化数据的存储成本,更好地管理和应用非结构化数据,挖掘数据中潜藏的巨大价值,进而帮助推动自身业务的增长与转型升级,也就成为了当前众多企业亟待解决的课题。
备受好评的HCP对象存储产品组合
俗话说“工欲善其事,必先利其器”,看到广大企业面对非结构化数据这座“金山”时如此困扰,Hitachi Vantara也为其提供了相应的“挖矿”工具,那就是Hitachi Content Platform(HCP)对象存储产品组合。
“以最常见的企业办公场景为例,文件服务ROBO(Remote Office Branch Office)经常需要做跨平台、跨地域的数据访问,其中像银行、MES、医院HIS等热数据都是跟核心系统紧密相关的东西;但是也有大量的数据,譬如社交媒体、库存、财务数据等,都是偏后线的,还有许多数据和文件来自多种渠道,甚至包括微信、微博、抖音等平台,所有复杂的应用场景和繁多的数据就变成了一种非常复杂的结构,我们称之为非结构化数据。为了满足客户的需求,对非结构化数据后续的分析和处理也就变得更加重要。”Hitachi Vantara中国区首席技术官吴卫平向趣味科技表示,“另一方面就是安全,这一点甚至可能比刚才的复杂性更加重要。目前互联网的安全问题非常突出,你想要在算法上、在数学机理上保证自己是不可被篡改的,就必须用到对象存储,这样才能够从根本上解决这类问题。所以这些年来,企业对对象存储的需求一直在不断增加。”
近日,全球知名分析机构GigaOm发布了《GigaOm非结构化数据管理雷达报告》,指出Hitachi Vantara凭借HCP对象存储产品组合位列领导者区域,并且正在向中心区域移动,这表明Hitachi Vantara在非结构化数据管理方面的能力将更进一步趋于完善、成熟。事实上,HCP产品组合已经连续四次获评IDC对象存储领导者象限,并且赢得了Gartner和GigaOm的一致认可,更被全球2,500多家企业机构青睐和选用。
然而Hitachi Vantara并没有就此满足,而是再接再厉携手WekaIO(Weka)推出了全新的分布式文件系统和管理解决方案,旨在帮助企业更加快速地访问包括邮件、文档、健康记录、音频、视频和图像等在内的非结构化数据,并从中获得洞察。
不久前,Hitachi Vantara还宣布了对HCP解决方案的全新扩展。此次功能扩展采用性能优化的全闪存HCP节点,可更好地支持新一代非结构化数据工作负载,以及更好的数据获取、可视化、保护、成本优化、检索和分析,连接边缘和用户设备,并支持私有云、公有云、混合云之间的智能数据移动性。
更安全、更易用、更高效、更具性价比
对于企业用户来说,Hitachi Vantara推出的HCP对象存储产品组合及其创新扩展,为他们带来了更安全、更易用、更高效、更具性价比的解决方案。
在安全方面,HCP是全球第一家通过十几家公司认证,符合欧洲和美国安全标准的平台。HCP的EC纠删码、DPL多副本保护、WORM(一次写多次读)、多版本管理、数据自校验和自修复等机制,能够充分应对各种物理故障、系统逻辑故障和人为错误,保证数据100%符合行业监管要求。
在易用性方面,HCP具备多项强大的原生功能,能支持客户通过平稳地改变现有主要存储的用途,显著提高存储的有效容量。不仅如此,HCP还提供了易用的下载和上传功能,并能有效监测和控制不断增长的数据量。此外,HCP产品组合中还包括了HCP Anywhere、HCP Anywhere Edge以及HCP Gateway,可通过建立基于对象存储的私有云,满足企业的远程办公需求。
在效能方面,由于采用了性能优化的全闪存HCP节点,HCP功能扩展后可帮助客户在Amazon S3协议上实现与以往相比3.4倍的吞吐率,并降低多达34%的成本。更新后的存储节点将读写性能也提升了三倍,并同时在与上一代产品相同的机架空间中实现了三倍的容量提升。为了满足高性能需求,越来越多的企业组织正将其传统NAS存储、主要工作负载和云原生工作负载不断迁移到对象存储。
在性价比方面,HCP在帮助企业提升业务效率的同时,还可以帮助降低存储成本。以医疗行业为例,医疗机构如果将影像资料保存在传统的NAS存储中,不仅成本高昂,而且响应速度也会随着数据量的增加而变慢;如果换用HCP建立分层存储,则可以根据需求从不同层级的存储中调阅数据,不但提升了工作效率,而且还降低了存储成本。
“今年全新扩展的HCP对象存储产品组合,其中的高密度存储柜可以在4U空间里支持差不多100块硬盘。如果以单块硬盘10TB计算的话,存储容量就是1PB,而且还可以通过增加单块硬盘的容量来继续加大存储空间。在业界能够做到这么高存储密度的,我们可能是仅此一家。”Hitachi Vantara资深解决方案顾问蔡慧阳补充道,“在每个TB单位存储成本下降的同时,还可以带来其他方面的好处,那就是节省机房和机柜空间,以及进一步降低能耗和制冷成本。这样如果遇上机房空间不够,或者是租用IDC机房的情况,我们的解决方案还能帮助企业进一步降低成本。”
值得一提的是,截至今年,Hitachi Vantara已为全球50,000家数据量超过16EB的客户提供100%数据可用性保证长达20年!“在存储领域,Hitachi Vantara有着自己独特的技术领先优势。”吴卫平向趣味科技表示,“以VSP 5000系列为例,它可以保证99.999999%也就是“8个9”全天候运行的正常运行时间和可靠性。而业内其他产品通常是6个9或者7个9,与VSP 5000系列有着10倍甚至是100倍的巨大差距。”对于银行、电信、医院等对安全要求较高的企业来说,VSP 5000系列是理想的最安全、可靠的存储解决方案。而同时VSP 5000同样可以作为HCP后端存储池的扩展,为那些寻求高性能、高可靠、多协议支持的用户提供非结构化解决方案。