“39”是数据,“体温39摄氏度”是信息,“体温达到39摄氏度,可能发烧了”这是知识。
不用担心,今天的话题与新冠无关,只是拿体温来说明数据、信息与知识三者之间的关系。
如今,政企的数字化转型越来越深入,开始朝着数字化原生组织转变,数据也逐步成为组织运营、创新和决策的驱动力。
然而,仅仅拥有数据资产并不足以完成这一使命。如同“39”这个数据本身并无价值一样,企业的数据也需要通过知识,才能转化为有价值的信息,进而产生驱动力。
正因如此,知识网络和认知智能,近来成为产业界关注的前沿焦点。
作为大数据基础设施服务商和全域数据架构创新者的爱数,在2021年初发布了其一站式知识网络平台AnyDATA ONE,通过化解企业的数据知识化和知识化分析难题,帮助企业把私域数据转变为有价值的信息。
以本文开头的“体温39度”来说明数据、信息和知识三者关系的,是复旦大学的肖仰华教授。
肖仰华介绍说,数据是我们对客观世界的符号化记录,信息是被赋予意义的数据,知识则是信息之间有意义的关联;而被认为人工智能下一个十年的认知智能,正是以知识的发现和应用为核心内容的智能形式。
语言认识、思维认知、文化认知这些高阶认知能力,是我们人类区别于其他生物所独有的能力。如今的认知智能正是要把这些认知能力赋予机器,让机器具备理解数据、理解语言、进而理解现实世界的能力,让机器能够解释数据、解释过程、进而解释现象,让机器具备推理和规划等一系列人类所独有的认知能力。
肖仰华认为,各行各业都在智能化升级转型,这对认知智能提出了全面诉求。正是在这样的背景之下,爱数与复旦大学合作,成立了“复旦-爱数认知智能联合研究中心”,双方联合开展认知智能的前沿研究。
此次发布AnyDATA ONE,使得爱数成为知识网络和认知智能领域的先行者,朝着“全球数据智能典范企业”的愿景迈出了里程碑式的重要一步。
今年是爱数成立15周年,AnyDATA ONE则是爱数AnyDATA产品线的开山之作。
它的推出使爱数具备了全域数据能力,即结构化数据、非结构化数据、机器数据和知识图谱数据四种不同类型的数据,分别用于记录企业的业务结果、业务内容、业务过程和业务活动的内在逻辑,是由爱数AnyBackup、AnyShare、AnyRobot、AnyDATA四大产品线承载。
爱数总裁贺鸿富介绍说,爱数做全域数据架构是非常伟大的梦想,前三大产品完成的是数据的感知和采集工作,相当于我们的“左脑”,而AnyDATA则是企业的“右脑”,帮助企业把数据转化为知识,实现数据智能,从而实现全域架构下的数据驱动型组织。
对于客户来说,AnyDATA带来了全域数据处理能力,得以变身为数据驱动型组织。对于爱数来说,AnyDATA强化了业绩增长的第二曲线。如今,作为爱数的新发力点,AnyDATA所在的数据智能业务,增长率已经超过支撑第一曲线的超可用业务,为爱数带来新的高速增长——2021年的预期增长率达到了101%。
爱数总裁 贺鸿富
AnyDATA曾经是爱数的品牌活动的名称。2016年,爱数举办了第一届AnyDATA大会,提出云中数据,探索无尽的数据潜力;2018年,AnyDATA大会提出数据即服务。
爱数产品副总裁李基亮说,把AnyDATA这个名称赋予爱数第四大产品线,是希望践行数据价值理念,在数字化和认知智能的下一个十年,为数据带来认知驱动力,开启一段全新的旅程。
他介绍说,要让原始数据成为有价值的信息,知识网络重点要完成两项工作:数据的知识化,分析的知识化。前者是把数据通过知识模型转换为多维度、多层次连接的知识;后者则在大数据定量分析的基础上,融合知识网络的逻辑和定性分析,提供可理解、可决策的信息。
对于一个组织来说,要构建和运营自己专属的私域数据知识网络,除了要实现数据知识化和知识化分析,还面临着持续运营优化的投入产出压力挑战。爱数AnyDATA ONE的推出,正是帮助企业应对这三大挑战,一站式化解数据知识化和知识化分析的难题,提供最佳性价比的解决方案。
基于AnyDATA ONE打造私域数据知识网络,主要有两大应用领域。
一个是以内容为基础的知识网络,可以被认为是水平领域的应用。其结合AnyShare辅助搜索和问答,用于提升企业的效率和体验。目前已经成熟的解决方案包括:智能搜索与分析方案、智能合同分析方案等。
另一个是以辅助决策分析为主的知识网络,可以被认为是垂直行业应用。其通常会结合大数据分析、内容分析,实现辅助决策,寻找最佳选择和策略。目前已经成熟的解决方案包括:面向数字政府的城市招商引资方案,面向企业服务的企业大脑解决方案等。
把数据转化为知识,进而通过分析产生决策,这样的知识化转型得到了企业的普遍认同。然而在此之前,包括知识图谱在内的认知智能,一直未能得到很好的推广应用,在很大程度上是因为其投入大、回报慢。
李基亮介绍说,爱数希望通过AnyDATA ONE的推出来帮助企业彻底解决这一问题,以简便易用、高性价比的方式来降低知识网络的构建门槛。
他把AnyDATA ONE的优势总结为一站式平台和端到端服务两个方面。
“一站式平台”,指的是AnyDATA ONE具备的一个启发式知识网络构建框架,多模型分析引擎和OpenKN开放框架。
企业在初次构建知识网络时,都面临着构建难度大、构建成本高、图谱质量难以保证等问题。AnyDATA ONE通过启发式的知识网络构建框架,来降低知识网络构建门槛。其实现方式是:先通过已有模型和基础模型进行初始化的知识网络构建,解决冷启动的问题,这部分的知识网络已经可以用于部分的搜索和分析场景;然后,基于已有的模型通过Tagger智能辅助标注和训练平台,以人机交互来不断优化。
特别值得一提的是,这些人工标注也可以通过智能辅助来实现,可以按照此前的模型将标注结果预先标记好,用户只需要对正确的标注进行确认即可,大大提升了易用性。以我们最常见的内容搜索为例,通过这样两个步骤的构建和优化,可以大幅度提高搜索准确度,按照用户搜索意图来查找到所期望的内容。
多模型分析引擎主要是服务于知识化分析,爱数AnyDATA ONE 提供“意图理解引擎”、“知识搜索引擎”、“图计算引擎”、“推理引擎”、“规则引擎”来实现落地,前两个更多地负责输入,而后三个则更多负责结果的输出。
以智能知识搜索为例,输入为用户的搜索语句,意图理解引擎会进行意图的理解;理解好的搜索意图会在知识搜索引擎中转化为知识网络的查询条件,由网络中的不同部分给出答案;知识网络会给我们匹配到知识点,这时候图计算引擎会根据搜索条件计算知识的排序,将根据权重计算返回结果给用户。
还有重要的一点,AnyDATA ONE提供一个开放的框架。通过OpenKN,AnyDATA的基础架构可以部署在公有云或者私有云平台上,并且提供基于知识模型、构建、分析的各类API,支持Serverless开发模式,满足知识应用自由组合,全面利用知识网络的能力。
李基亮所说的“端到端服务”,指的是开箱即用的简化平台,和全订阅模式的长期服务。
他介绍说,爱数AnyDATA ONE 的产品和数据服务全部采用订阅模式,它不但体现知识就是价值,而且软件、算法的持续运营价值,软件按照使用量实行阶梯订阅,并且可以跟爱数的生态合作伙伴一起,基于SaaS订阅联合提供丰富的领域数据服务。
爱数为所有AnyDATA的知识网络项目都设定了一个三年的效果目标——相比传统搜索和分析,知识网络的效率和效果至少要好十倍。基于这样的信心,爱数承诺用户可以随时停止订阅,并且通过软件和数据资产的保障计划,来保证订阅逾期后功能不限、数据无忧。
爱数产品副总裁 李基亮
“数字化的下一个十年,是认知智能的十年,也是知识网络的十年。”
伴随着数字化转型的深入,知识化转型将成为各个行业、各类组织提升业务能力的重要抓手。利用私域数据来构建知识网络,也将成为企业提升自身竞争力的重要途径,在未来十年里驱动着企业的创新发展。