文丨谢怡静 卢滢西
编|张艺
俄乌冲突下,甲骨文、SAP等科技企业纷纷停止在俄罗斯的业务,这再次引爆“去IOE”(指IBM的小型机、Oracle的数据库、EMC的存储)的话题。国际形势波谲云诡,只有自力更生,将底层基础科技能力夯实才能避免“卡脖子”。
数据库作为智能时代的基础设施之一,国产替代需求也正在爆发。
人工智能、云计算等技术逐步落地,导致数据量规模呈指数级增长,数据的存储和应用就面临着更大的机遇和挑战。
一方面,随着政策利好,数字化转型大潮,以及市场教育逐渐成熟,国内企业的IT支出提升,数字库行业迎来发展机遇。
据中国信通院测算,2020年中国数据库市场规模约241亿元。预计到2025年,中国数据库市场规模将达688亿元,年复合增长率为23.4%。然而,2020年我国数据库市场规模在国内IT支出占比约0.9%,而全球这一比例则达1.9%。两组数据都表明,我国数据库市场增长潜力巨大。
另一方面,目前海外巨头仍占据国内市场的主要份额,如,2020年国外厂商占据我国数据库市场80%以上份额。但是,随着云化和国产替代趋势下,国产数据库在未来将释放很大的市场空间。
那么,在外企包围下,国产数据库如何逆势发起突围?有哪些弯道超车的机会?
3月19日,光锥智能联合Scale Partners势乘资本,与腾讯云数据库副总经理王义成、偶数科技CEO常雷、Kyligence合伙人兼副总裁李栋、欧若数网NebulaGraph CEO叶小萌、红点中国合伙人刘岚、建信(北京)投资高级投资经理等行业一线的前行者,对于“国产数据库的突围”进行了深入探讨。
国产数据库的机会
1、国产数据库市场的现状
腾讯云数据库副总经理王义成:
从市场的角度看,整个大环境令数据库的自主可控成为大趋势。据不完全的数据统计,目前国产数据库厂商有200多家。这些厂商大致分为四大类:
第一类,云厂商。如:腾讯云,阿里云,华为云等云厂商下场做数据库。
第二类,传统数据库。如:南大通用,达梦,金仓、汉高、优选等。这类企业的商业模式更多license(授权许可)模式和软件售卖模式。
第三类,新兴数据库厂商。如:PingCAP 的TiDB,它是从HTAP场景切入。
第四类,换道厂商。一类企业如:恩墨、海量等,他们从做服务转到做数据库。还有一类企业如亚信和中兴,他们之前从某一行业内做行业应用,换到了数据库的赛道。
国产数据库的机会很好,但是厂商过多导致市场很卷,对于客户来说也会出现难以选择厂商的问题。这个市场需要一次大浪淘沙,市场寡头出现后将进入更合理、更稳定的状态。5~10年的时间,经过市场竞争后,会逐渐出现名次排序。
红点中国合伙人刘岚:
2015年左右,我们开始投资数据库领域,当时还没有太多国产的概念。2020年,因为国际局势变化以及国内政策的支持,更多创业者进入这个赛道,也有更多资本愿意投资。
不过,目前这个赛道已经有点超共识。
一个非常早期的团队,大厂出身并具备一定的经验,资本市场给的估值相对较高。但这个赛道是长周期的。数据库是基础软件产品,从第一行代码开发,到第一个版本推出,到第一个客户落地,第一个商业场景的落地,至少需要三年时间。但从资本角度来看,都期望今天投的这家公司,明天就产生收入——这违背了企业的发展周期。
希望资金入场后要有耐心,也希望赛道在大浪淘沙后,能真正跑出来自主可控,与国际玩家一较高下的企业。可能金融的部分场景,特别是事务型的数据库,目前还是离不开全球排名前五的数据库厂商,但是,未来希望国内不管是创业者还是大厂都可以逐渐占领这块市场。
偶数科技CEO常雷:
中国的数据库市场规模基本上占到全球十分之一左右,但全球市场中,国外厂商占据主导地位。国内现在很多核心应用场景,如交易场景、分析场景等基本上也是用的国外数据库,这其实是卡脖子的状态。
不过,最近几年国内厂商百花齐放,正在崛起。但也是鱼龙混杂,客户在选择时需要注意以下几点:
1)认准技术的潮流和趋势。如云化是很大的趋势,不要选择一些过时的技术;
2)产品的成熟度。市场上的产品有很多,是否核心自研很重要。现在开源很热潮,但如果只是拿着开源进行加工包装再形成的产品,容易形成很多问题,比如:后续的支持和修复很难跟的上。
3)数据库的开源和闭源本质区别不大。用户会关注,但是并没有那么重要。
建信(北京)投资 高级投资经理 朱明阳:
国产化还有很长的路要走,在产品性能、生态建设、服务体系的构建上还有提升空间。同时,国产机会也很大,国产替代酝酿出的存量市场,还有国产数据库份额占比提升所带来的增量市场,会给厂商带来机遇。而且在国际环境变化下,国产替代有加快的趋势。
回到行业本身,数据库的技术分叉有很多,不同的技术路线对应不同的场景,我们总体感觉市场是比较割裂的。数据库市场规模约三四百亿元,每年的增速维持在20%。但细分市场规模大部分在几十亿,比如确定性很高的信创市场又能细分为政务信创和行业信创。场景对技术的要求不一样,适合的产品也不一样,每个市场有细分的技术路线,但每个市场的机会也就是几十亿的规模。
细分技术路线都需要一定投入,所以想在所有领域追赶国际厂商,可能不太现实。
做好市场定位,找准细分市场,找准优势,对于第三方独立厂商来说很重要。我们会关注这样的企业:市场定位清晰,有行业资源的积累,产品自主可控,源代码自己写,资质齐全,生态打通,服务支撑体系健全,有代表性的案例。
2、国产数据库崛起的机遇
腾讯云数据库副总经理王义成:
Oracle的市场有多大,国产数据库的机会就有多大。国产数据库的未来主要就是“去O”。中国数据库市场“去O”大概分成三大阶段。
第一阶段,优秀的互联网厂商几乎都没有把自己核心命脉或核心业务请求放在Oracle之上。从BAT到第二代、第三代互联网企业,如京东、美团、滴滴、叮咚买菜等企业都没有选择Oracle来支撑主要业务。
第二阶段,正在“去O进行时”。很多政府、金融、民生类业务,如互联网银行微众等,也没有选择用Oracle去支撑。一部分先行的企业已经开始做新兴业务,他们选择云数据库厂商提供的服务,或者一些初创企业的服务,这也是国产数据库的机会。
第三阶段,则是在商业数据库的深水区“去O”。传统八大行业的数据库替换是比较难的,如金融、交通、能源等与传统数据库绑定。这个阶段是否能实现国产替代,需要厂商与甲方一起把传统业务最核心的部分拿下,这是未来的机遇。
偶数科技CEO常雷:
数据库市场增量有两个机会。
一是上云趋势很明显。此前很多企业都在云下,现在“云上”成为弯道超车的机会。
二是传统国产替代,不要只盯着交易型,其实分析型场景也是一个有巨大增量机会的市场。许多传统行业,目前数据依然没有被很好地开发和利用,但他们这方面需求正在爆发。在这个领域,大家渐渐不会再采用传统的Oracle,所以有海量的新机遇。
建信(北京)投资高级投资经理 朱明阳:
目前市场有几个趋势:
一是云化。新架构意味着新机会,尤其是现在整个互联网行业趋势在下行,对成本的控制也比较强烈。一些传统企业也在接受非核心数据上云。云化趋势中,一些大的厂商优势相对较大。
二是信创。目前,信创的渗透率不高,大约10%。这意味着,从内网到外网的替换机会比较大。
三是核心业务系统替换。金融行业、运营商行业等核心业务系统的替换,是一个漫长的过程,需要甲方有决心跟耐心去接受国产系统。
四是分析型市场。分析型市场虽然说在国内目前占比不是很高,但随着数据量的增加,以及数据模型、数据类型的涌现,分析型市场也在不断被激发。
红点中国合伙人刘岚:
云计算兴起,随着数据处理,数据站等变化,带来了一些新兴的需求和机会。
从早期投资人的角度来看,我们观察的还是数据领域,技术和需求再往下演进需要什么?比如,两年前,疫情刚刚爆发,我投资了欧若数网(Nebula Graph),当时看到的机会就是图数据库的市场需求激增。2020年 Gartner报告显示,每个细分领域都有全球数据库管理系统(DBMS)的增量,其中大部分增长在10%内,只有图数据库是20%左右。
过去一年到现在,我们也在持续思考,比如,云原生后,所有的IT基础设施上云以后,会发生什么样的变化,大家需要是什么。
中国整个IT基础设施的演进和美国非常类似,可能中国会比美国晚五至十年,但中国的增速非常快。其中,最大的机会来自金融行业。下一代的分析型数仓架构,正向“湖仓一体”变化。“湖仓一体”带来的其实就是传统IT变化,整个数据的抽取和清洗的变化。一些新需求,带来新机会。
3、作为云厂商,腾讯云数据库是如何整体布局的?
腾讯云数据库副总经理王义成:
腾讯云主要是从产品角度打动客户。
第一个布局点是整个公司层面的投入。首先,腾讯数据库团队有近1000人的研发团队,而且腾讯对于数据库的投入还在逐渐加大。数据库和腾讯会议也在腾讯公司2021年Q3财报中被重点提及,从公司层面也非常重视。
第二个布局点是腾讯的数据库在集团内部有长期实战积累。我们的团队从2002年成立,对内支撑了财付通、腾讯会议、腾讯视频、微信支付等海量业务。
然后,腾讯数据库开始从内部走向外部公有云,如腾讯投资的公司,包括拼多多、美团、每日优鲜等。最后,再走到线下形成输出,去服务运营商、保险、银行等。
如今,市场上数据库玩家众多,谁能在大浪淘沙中活到最后?
我觉得要解决两点,一是解决交付成本,二是解决获客成本。在获客成本领域,微信的小程序可以实现用代码方式直接帮助用户拉起底层数据库,腾讯云可以将获客成本降到足够低。此外,腾讯云拥有大量公有云客户,可以做产品验证,不断的进行产品更新和测试。解决交付成本核心在于建设数据库生态,很多转型做数据库的优秀服务商都在拥抱腾讯生态。
产品的核心力建设、公司的持续投入、多云的部署模式,其实都是要解决的交付成本和获客成本。
4、红点在大数据领域的投资逻辑
红点中国合伙人刘岚:
红点中国专注投早期,持续关注的是技术驱动下的新需求变化,同时也对技术提出了新的要求。2014年,我们在美国投资了Snowflake的B轮,当时就是看到了市场上有云原生的数仓需求,而Snowflake提供了很好的解决方案。国内也是因此,和美国团队去交流后,我们认为这个趋势在中国一定会出现,所以2015年,我们找到Kyligence,2016年找到偶数科技。
过去的一年,我看见不下十家早期中国创业团队,第一轮融资后就出来说要做中国的Snowflake、Databricks。坦率说,如果做完全一样的云原生数仓,这些创业团队有点晚了。也许你能拿到1亿、2亿美金来支持行业发展,但整个产品的成熟还需要一定时间去沉淀。
大数据、数据仓库,数据库领域在中国有很多的机会,希望创业者出来以后,能够瞄准自己的市场需求,踏踏实实把产品做好,为行业以及技术发展做贡献,而不是说单纯说“我就是中国的Databricks”。只有把产品做好,才能够真正的在市场上立足。
过去的一年,也有很多资本进来。资本是双刃剑,拿钱多的可能跑得会更快,但产品成熟度是有一定的时间周期和规律的。资本要有耐心,可以陪这些公司跑下去。
5、国产AP(分析型数据库)的机会
偶数科技CEO常雷:
一方面,云原生分析型数据库对客户有两大好处:一是可以节约成本;二是存算分离,可以实现超大规模集群。
从技术层面看,已经可以解决“湖仓一体”的本质问题,而不是“湖仓分体”。
这两点是客户的痛点,也是我们布局市场的思路。
云化趋势下细分领域数据库的优势体现
1、混合云环境下,有什么样的挑战?
腾讯云数据库副总经理王义成:
有报告曾预测,未来75%的数据库将会跑到云上。上个月我和分析师交流时,他们认为2023年,这个比例有可能会到80%。
2012年,互联网客户对于云数据库的选择,或对云的选择都是中立观望的态度,2016年后才开始出现大客户。实际上,最初的互联网客户选择云数据库,主要是因为IO的性能不足,才选择了云数据库。但现在,整个泛互联网行业选择云,已经变成天生的选择了,不再去纠结。
IDC的报告显示,在IDC机房租用的资源,带宽和相应的成本已经和真正机器的成本不相上下。这个趋势导致选择云比IDC自建有更大的优势。或许有些厂商发展到足够大后,出于成本的考虑,会和云厂商博弈,但至少我们了解的许多大客户,从云搬回IDC的很少。
此外,一般来说,政府、金融等行业出于自身考虑,不可能去做云化,但今天也出现了很大的变化,比如建行和银联基于腾讯私有云,去搭建自身的建行云和银联云,然后在自己的云上开展相应的服务。政府领域,广东的政务云也是基于腾讯的私有云平台构建。这类金融和政府可能并不算公有云,但是经过讨论,只要是云厂商提供相应技术,大客户进行孵化,分析师认为这也叫云,所以也属于云数据库。
综上所述,我觉得80%的数据并不夸张,这是大势所趋。
偶数科技CEO常雷:
针对厂商来说,混合云相对来说还是比较新的。但混合云很大的痛点,就是怎么把混合云上的数据和应用打通。数据打通其实很难,尤其是公有云和私有云,两边还是公网,如果拉专线也比较麻烦,尤其是上面是各种各样的数据库,本来要一体化的数仓或者是数据库,也就是湖仓一体,又可能因为混合云隔离了。在这个领域,还有许多新的问题需要解决。
Kyligence合伙人兼副总裁李栋:
在云化的趋势下面,我觉得可以从数据角度做一些思考。
企业在面对不同的技术选型时,以及不同业务开展时,都会面临各种各样挑战。举个例子,银行客户很多核心交易数据必须在本地,但一些互联网业务会选择在云上,甚至一些跨国企业在出海时,会选择多元业务,因为在不同国家和地区会面临不同的技术选型。以前建数仓需要把一个集团的数据导到统一的数据库进行集中式管控,现在数据是分散的,且由于政策原因,技术原因等等很难存储在一起。
我们看到的趋势是,随着技术架构的变化,数据存储很难实现集中式存储,一定是去中心化的架构。数据仓库的概念,本质上也是告诉大家,可以接受数据隔离或者从物理隔离的现状,更多采取在原数据或者从管理手段上的统一管理。
Kyligence其实也在分析型数据库赛道,那我们如何帮助客户解决这个问题?
我们是 Apache Kylin 的商业化公司,提供企业级的多维数据库产品。多维数据库中的多维数据模型,是很好的分析型数据资产的承载体,可以在数据孤岛情况下实现统一的管理。我们的产品不仅提供一个SQL引擎,而是提供多维数据模型的概念去连接不同的数据源,并统一定义和管理业务分析使用的数据模型、维度和指标。通过这种方式,数据在混合云或者多云的情况下是分散的,但这些多维度数据模式是统一管理的。
欧若数网NebulaGraph CEO叶小萌 :
我们接触的客户中,可能有90%的客户都会用混合云或者多云策略,包括我们自己现在作为一个初创公司,也用了很多的云,这是一个非常自然的选择。一方面的话是从成本层面考虑,另一方面,很多用户也不希望被某一个厂商锁定。
图数据库也属于数据库,所以说,我们面临的挑战几乎是一模一样的。比如从AP角度,如果用户的数据去中心化,可能是跨云的,那我们需要考虑怎么跨云快速access(访问)。但一旦跨越access,成本就会增加,如何降低用户的成本则从技术层带来挑战。从TP(交易型数据库)角度,在线数据库很多数据会涉及隐私、合规的考虑,有一些数据是不能放到公有云上,比如说像金融行业、医疗行业。这类数据必须放在私有云上,这种数据如何共云?数据透明后可以放到AP上,然后利用公有云的海量资源对数据做分析。但在TP角度,怎样把大量在私有云的数据和公有云上的数据进行打通?
2、“东数西算”背景下,数据库会有什么样的变化?
腾讯云数据库副总经理王义成:
“东数西算”对于数据换算的效率,或者整个数据提供的模式上有较大挑战。
第一是数据库布局需要多元化。基于大背景,腾讯在未来可能会有多种数据库的布局。目前云上我们大概有近二十款相关服务,也会继续扩大引进不同模式的数据库。
第二是算力提升。迎合数据量级提升大趋势下,我们要利用好新的硬件。因为数据量很大,整个计算的周期也会变长,计算精准度也要提升。那么如何将数据库和新硬件结合?首先是要用存储计算分离,把新硬件和缓存结合,在性能和技术价格之间选择综合方案。
偶数科技CEO常雷:
“东数西算”以及“双碳”,都对数据库提出了新的要求。比如说新基建中,数据中心都要云化,这对所有云厂商都是很大的利好。从国家层面,可以设置一些相关的标准,比如,在上面跑的云或者软件,是不是真的节能。
Kyligence合伙人兼副总裁李栋:
东数西算、西气东输、南水北调本质上都是资源调配。数据作为一种资源也在进行调配。
数据是石油,但石油需要加工才能被广泛使用,如何把数据从资源变成更高价值的产品是关键。很多金融客户也在探索如何把数据从资源变成产品。
实际上,能用最经济实惠的方式把数据变成产品(Data as a Product),是最关键的,数据能给业务带来什么价值才是最核心的。
欧若数网NebulaGraph CEO叶小萌 :
东数西算是资源调配,对于厂商来说有一定要求。大量数据从东部往西部迁移的过程当中,并不是免费的。
所以,第一个要求就是对数据的压缩、传输方式会提出比较高的要求。怎么样把海量数据以非常低的成本实现远距离传输。对于我们而言,可能会在数据传输上考虑更优秀、更高效的方式。第二个则是在存储计算分离的基础上,能够对计算资源调控,做到按需分配。这样可以进一步提升整个资源的使用率,同时降低用户的成本。存储计算分离也是我们目前在做的事情,在传统的存储计算分离的基础上,我们更多地考虑资源的动态分布、动态分配的能力。
国产数据库的商业化路径选择
1、开源数据库与商业数据库,商业化路径如何选择?
腾讯云数据库副总经理王义成:
开源的本质也是商业化,要从宏观层面看是否能满足一家公司的长期商业利益。
国内很多厂商做开源,但有成功商业逻辑的还比较少。
开源的本质还是扩大生态,扩大你的影响力。开源还是要找清楚自己的定位,目标客户群。开源能否帮助产品突破,帮助公司完成阻击。还需要具体问题具体分析。
偶数科技CEO常雷:
开源有开源的好处。开源之后,互联网公司和用户可以很简单地理解产品内核,然后帮助做市场宣传。开源也有开源的坏处,容易同质化。现在大部分成功的软件都是闭源的。但对数据库的早期发展来说,闭源没有开源那么容易做市场。综合角度来看,各有利弊。
欧若数网NebulaGraph CEO叶小萌:
开源是为商业化服务,大家不会只为了情怀来做一个家公司。
在数据库行业,其实有非常多成功的开源公司。开源的好处是在项目的初期能够带来大量的用户。比如说,我们在投入新领域时,如果一开始不做开源,很难触达到一些潜在的客户。另外,基本上每一个成功的开源数据库公司的商业模式都有一个共性,就是上云。这令我们思考,在国内云还没有完全流行的阶段,我们应该如何做商业化?
Kyligence合伙人兼副总裁李栋:
开源商业化常见的有两种,一种是Open Core,一种是SaaS模式。我认为,开源的本质一是技术的创新,二是商业的增长,关键是把两者形成闭环。
从市场的角度看,一些开源用户来自互联网行业,目前面临的技术创新挑战更大,新技术会从这个行业先诞生,然后逐渐开源。比如,Apache kylin最早的容器化方案就是从互联网行业开源,后续发现金融行业也有容器化需求,其基于开源储备,就可以通过技术创新的方式服务商业。同时,商业里的复杂场景和高级特性也可以反哺开源,促进技术创新。
2、国内数据库企业出海有机会吗?
偶数科技CEO常雷:
国内市场有特殊性,相对海外市场更加不成熟。
一是客户习惯了厂商围着转的状态,在定制化文化严重情况下,厂商需要解决一个问题——如何让自己的产品,在客户端不会因为一些不必要的要求进行各种定制化。
二是收费模式的不同。国外已经从license模式走向了订阅模式,但国内订阅模式依然不是主流,客户对于订阅制模式依然在接受的过程中。
我觉得先把国内市场做好,再做海外。出海过程中,相对国外厂商,中国也有一定优势,如技术优势和成本优势。
Kyligence合伙人兼副总裁李栋:
我们可以发挥中国市场的特色。在国内的经典打法是先树立大客户标杆,再进行复制。在美国,企业喜欢用农村包围城市的方式,从中小客户中沉淀出大客户。
比如,国内一家数据服务公司首先收获的是金融行业头部的银行客户,这些客户无论是数据量,还是数据分析复杂度,在行业内都具有代表性。通过这些大客户的场景,国内企业出海时会发现场景有共通性,而且具有领先性的。因为国内人口基数大,数据量和分析场景比海外更具技术挑战。所以我们可以在国内与标杆客户把产品打磨好,再到海外复制成熟场景。
欧若数网NebulaGraph CEO叶小萌:
根据去年信通院的数据,中国整体的数据库市场只占到全球数据库市场的7%-8%。
所以,我的第一个观点是:任何一家中国数据库公司,都应该有全球化思考。在中国做数据库或者大数据方面的公司,总数不会比海外的要少。然而,整体国内市场只有海外的小份额,就算增长速度非常快,能达到百分之二十,公司整体估值也只有海外公司的百分之二十。所以要做大,必须要去海外。
第二个观点是,我们应该充分利用好国内市场的特点,如:中国有非常好的标杆客户,有非常复杂的应用场景,庞大的数据量等等。如果我们能服务好国内的标杆客户,出海时则是降维打击。此外,我认为对于任何一家出海公司来说,除了技术能力外,还需要强调易用性,需要了解海外文化。