天极大咖秀

登录 | 申请注册

PingCAP CEO刘奇:一个好的数据库不是写出来的

阿明观察 2021-07-29 阅读: 6,290 次

“一个好的数据库不是写出来的……”

PingCAP创始人兼CEO刘奇的这句话,道出了开源数据库厂商创新发展的心声。

2021年7月24日,PingCAP DevCon大会现场,云集了上千人的广大开发者、用户、生态伙伴,大家现场近距离感受TiDB企业级开源分布式数据库,以及更省心的TiDB Cloud全托管的数据库即服务产品,此时谁会想到六年前,PingCAP毅然在国产数据库面临巨大发展挑战的情况下,选择了一条被众多传统数据库厂商难以看好的开源之路。

打磨,一个好的数据库是用出来的

多年之前,中国的国产数据库面临国外数据库巨头的碾压,发展非常缓慢,究其原因,最为引发业内讨论的便是国产数据库缺乏广泛用户环境的实际应用。要知道,Oracle甲骨文可以成长为全球数据库巨头,在其发展初期也是经历了众多行业用户实际应用反馈与持续优化的过程,才造就了后来的高稳定与高可靠。

像数据库这样的基础软件,其生命力必然源自真实场景的长期打磨。然而继续走传统国产数据库厂商的老路,在云计算与大数据时代显然很不容易走通。PingCAP创立之初,就已经为TiDB确定了开放开源的发展之路。

六年开源数据库之路,为TiDB带来了令传统数据库厂商难以想象的发展机会与成长速度。

到目前为止,PingCAP创立的开源项目在GitHub上有超过41600个star,同时有超过1400多位贡献者,贡献者遍布了全世界几十个国家和地区。

超过4万多个Star的开源项目,这是一个什么样的概念?了解Github的业内人士多有耳闻,评价Github平台上的开源项目,其中一个重要的标准必然少不了要看Star数量。一般情况下,如果看到个超过100以上Star的开源项目,基本靠谱可行。Star超过1000,应当是非常流行的开源项目。倘若一个开源项目Star超过10000以上,必然成为全球引领“群雄”的顶级水平。

发展到今天,PingCAP的开源项目自然不再局限于分布式数据库TiDB。近两年来,PingCAP创立的两大开源项目TiKV键值数据库Chaos Mesh®云原生测试平台,先后进入到云原生基金会(CNCF)进行孵化。作为TiDB的存储引擎,同时也是一个独立的分布式键值数据库项目,TiKV在GitHub上拥有了9600多个star,并且已经成功服务于京东、美团、知乎等许多知名企业,应用到了行业用户的生产环境。

Chaos Mesh®属于靠后一些成立的开源项目,2020年作为CNCF沙箱项目,目前在 GitHub上拥有300多个star,并且Chaos Mesh也获得了包括腾讯、微众银行、小鹏汽车、七牛云等众多用户的积极采用,成为云原生环境下故障演练的必备工具。

基于旗下三大开源项目的贡献,在2019-2020年CNCF年度贡献度排名中,PingCAP位列中国企业第一,全球排名第六。

从新近创立两大开源项目到六年前创立的TiDB,从中我们不难发现PingCAP成就了今天的行业影响力与开发者社区地位,存在一个普遍的PingCAP发展定理,即:好的数据库产品是“用”出来的,不是“写”出来的。

但是,如何实现广泛的应“用”与发展呢?这个事情对于多年之前的传统国产数据库厂商而言,想都不敢想,更何况还要实现广泛真实场景的应用。

开发者、用户与PingCAP的TiDB、TiKV和Chaos Mesh®之间的共生关系,好似水、水草与鱼之间的互相关联,互为生态,带来的互为成长。基于广泛的真实场景应用打磨,汇聚开放而强大的开源社区力量,成为助推TiDB数据库产品不断演进与快速创新的动力。

PingCAP创始人兼首席执行官刘奇认为开源的本质在于连接,即技术人才的连接,开放生态的连接,业务创新的连接。既然开源本质是连接,那么把TiDB的开源数据库看成代码开源只是一种狭隘的开源认识。开源的本质并非只是代码的开放,代码只是一个载体,需要建立开源体系,构建人才协作、用户互动、生态开放的连接平台,这也是PingCAP的理想与信仰。

基于开放开源的信仰,在PingCAP创立与发展的过程中,PingCAP一直认为TiDB、TiKV和Chaos Mesh®都不是PingCAP的产品,而是属于所有开发者、用户DBA和运维工程师共同协作与持续创新的成果。

  • PingCAP创始人兼CEO 刘奇

与此同时,超过1500个企业的真实场景,不仅是成就TiDB的沃土,也是其最好的架构师。这才是一个开源数据库“快速迭代,持续创新”的源动力。真实场景的不断应用打磨,为开源社区开发者带来了足够多的“刺激”,全球优秀开发者的聪明才智在一个开放的全球化平台上得以发挥。

TiDB产品迭代速度非常快,每年TiDB都会变得不一样,每年大约有 50%以上的代码会被重写。在六年时间里,进而推动TiDB持续迭代了五个版本。总体而言,TiDB有40%的代码,源自PingCAP公司之外的开发者、用户、运维工程师的积极贡献。

可见,开放的力量与时间的力量,两大力量的叠加效应,不断打磨TiDB,促成TiDB在不断演进中形成了一个有生命力的开放生态。

立足当下,面向未来,TiDB演进路线图也已十分明了。从2017年10月TiDB 1.0 GA版发布,到2021年4 月TiDB 5.0发布,以及最新的TiDB Cloud发布,PingCAP会始终如一地坚持基于用户真实场景打磨与社区贡献者共建共生共创新的产品演进路线,同时在近期的版本更新方面,会聚焦在OLTP、HTAP、云原生、TiDB Cloud等多个重要方向,打磨不懈,创新不止。

破圈,深入更广泛的企业级市场

如果说TiDB的成功,源自用户的最佳实践与社区共建,那么从互联网到企业级,PingCAP正在经历一次新的跨越。

传统数据库的诞生,其实也植根于企业级用户广泛的应用与实践,甲骨文数据库当初能够称霸全球,成为传统数据库的全球巨头,自然离不开用户广泛应用带来技术反馈,从而促进数据库技术创新与迭代。

坚信开放的力量,PingCAP公司成立之初,就已将TiDB作为一款企业级开源分布式数据库来打造,基于开源的力量,营造广泛的用户应用实践环境,从而能够在企业级市场打破技术壁垒,打消企业用户对于开源数据库可用性的顾虑。

再者,一个好的开源数据库历经众多真实场景应用的打磨,必然会从互联网领域走向更广阔的企业级用户市场。这是数据库成熟发展的必然之路。

从开源社区走向企业级市场,想要成就更多企业用户的数字化转型,PingCAP已经从几年前服务北京银行开始,着手将数据库的企业级需求作为了TiDB不断演进的强大动力。

在2021年,“破圈”成为PingCAP公司借助TiDB开源数据库深入更广泛的企业级市场的下一步重点。

在数据库领域,想要破圈,必先入圈。

在PingCAP创始人兼CEO刘奇看来,数据库作为一款基础软件,本应该有着行业普惠的作用,PingCAP具备的产品能力和美好愿景,不仅针对互联网用户,而是面向更广泛的圈层,包括to B企业级用户市场。

当前,TiDB已经应用于1500+全球企业的真实场景,分布在金融、新经济、电信、制造、物流、零售、公共事业等领域。比如从知乎平台到移动支付,从美团外卖到顺丰、中通快递,从爱奇艺视频到网易游戏……各类大家熟悉的互联网场景,都有着TiDB在背后默默的支持。

全球云观察分析认为,在企业级数据库领域中“破圈”,必然需要为企业级用户带来惊喜才会有震撼的效果。

既然要面向更广泛的企业级用户市场,自然就少不了用户尤其关注的企业级特性。那么,问题自然来了,TiDB产品自身的易用性、稳定性、可靠性、可用性到底如何了?行业解决方案的完善程度、服务能力到底又有多强大?

空口无凭,拿真实应用场景的事实来说话。这就是PingCAP对外一贯的企业风格。

在新经济行业领域,汽车之家采用TiDB解决了SQL Server应用痛点,不仅实现了集群内节点扩容的水平伸缩性,同时支持十亿乃至百亿级的海量数据规模,在高可用性上实现100%的数据强一致性,也支持一定程度的OLAP场景,更复杂的OLAP分析可以借助更强大的TiSpark引擎来完成。在上线 TiDB 5.0后,聚合场景查询相比MySQL带来了20-50倍的效能提升,应对千万级DAU和亿级访问量显得更为从容。

58集团基于分布式数据库TiDB构建了水平伸缩的资源扩展能力,减少了分库分表的麻烦,同时TiDB多副本功能带来了数据的安全性与高可用性。在上线 TiDB 5.0引入TiFlash MPP后,海量数据分析计算能力得以更大提升,在多表关联查询中,相比TiDB 4.0性能提升高达90%。

之前,360公司采用TiDB后,相较MySQL部署模式节约了40%服务器成本,系统可用性超过99.95%。618、双十一QPS最高达25W/s,工作日99%的SQL都在15ms以内,实现了响应快,稳定性,扩展性都达到了预期效果。

在数字化转型企业领域,中通快递实现了从Exdata到TiDB HTAP的升级之路,TiDB扛住了35万+的QPS峰值压力,百亿级的插入与更新,被TiDB扛住了,加上TiFlash MPP支持业务在线的分钟级统计分析,报表时效性从过去的5分钟缩短为1分钟。

在金融行业领域,平安人寿构建了TiDB分布式数据库集群,为活动类、运营类、创新类等多种应用系统提供数据服务,满足其实时、便捷与准确的查询服务要求。平安人寿金管家业务作为整个平安人寿下迁移Oracle数据库的排头兵,金管家应用到TiDB上的数据规模超30TB,预计整体应用规模将达到百TB级别,引领了保险行业的科技创新模式。

北京银行在两地三中心部署TiDB集群,基于主从多活架构,主从之间采用Kafka同步Binlog的形式进行数据同步。北京银行在网联支付清算平台和银联无卡快捷支付系统首先引入TiDB分布式数据库,应对双十一的大数据量与高并发的挑战。与此同时网联业务链的相关服务部署也实现了分布式架构升级,完美对接TiDB,实现金融服务能力的全面提升,在2020年,北京银行分布式核心系统建设项目获得了亚洲银行家“中国最佳核心银行技术实施”大奖。

在公用事业领域,吉林祥云上线TiDB助力吉林省政务数据共享交换平台和吉祥码数据管理平台,不仅打破了之前吉林省各个委办厅存在的数据孤岛状态,实现多源数据的关联应用,而且也为吉祥码提供了强大的高吞吐量与低时延的数据管理平台支撑,实现了单表几亿数据同步复制,以及扫码情况的实时统计分析。此外,TiDB高度兼容MySQL,降低了业务代码开发和迁移成本。

可见,超过1500个众多行业领域真实场景的成功应用,彰显了TiDB在数据库领域具备独特的开放性、伸缩性、安全性、可用性、可靠性,其企业级特性能力正好为企业数字化转型所聚焦的业务敏捷和实时洞察带来了实际价值的提升。特别是在实时洞察方面强化,非常有助于驱动企业释放数据的价值。

当然,这些企业级特性与行业技术能力,最终需要转化为企业用户真实场景的落地。为此,PingCAP在助力企业级用户全方位场景落地方面,特别构建了企业级商业服务体系,其中包括产品订阅、售后支持、专家咨询,以及专业培训与认证等方面。

PingCAP企业订阅服务,可以为企业用户在有效期内持续享受企业版产品带来的创新价值与能力,享有不限次数的远程产品技术支持和专业指导。

PingCAP专家服务,可以为企业用户提供现场架构咨询、应用适配、知识传递、深度巡检、扩容变更支持、规范与手册定制化等帮助。

特别值得一提的是,根据企业用户实际需求,PingCAP可以提供TiDB定制化课程内容开发和交付,帮助企业培养具备全面架构和开发能力的数据库人才队伍,这是众多数字化成长与转型的企业非常重视的领域。

由此而言,对于开源的信仰,坚信开放的力量,已经深入到了PingCAP在社区、技术、产品、服务、生态等方方面面,“相信开放和透明的协作,必定会创造出全新的无限可能。”

随着PingCAP深入更广泛的企业级市场,破圈也必然会发生。

释放,中国的也是世界的

从另外一个角度分析来看,坚信开放的力量,必然可以为PingCAP面向未来的发展上,带来更为丰富的动能。

PingCAP诞生于中国,更是诞生于开源的世界。

开放的PingCAP,开源的TiDB。自成立之初,PingCAP就将TiDB作为了立足中国面向全球企业用户的数据库产品。因此,TiDB在数据库领域的发展始终如一地坚持走本土化与全球化结合的国际化发展道路。

虽然TiDB是中国的,有着众多中国本土互联网用户、企业用户等典型应用的最佳实践,但TiDB从诞生到如今也是基于全球开发贡献者的共同努力与创新的结果。

从六年的真实用户场景打磨,到面向全球企业级用户市场的破圈举措,释放开放力量的重要途径自然离不开生态,即建立开放生态的连接。对此,PingCAP还特别推出了最新的Ti-Star生态计划,通过“混合生态”,为企业自身成长和业务的转型创新注入PingCAP原厂级活力。

TiDB在企业级开源数据库领域的发展成果,自然也是离不开混合生态的使能,其中包括了来自开源社区带来的独特价值,以及企业级产品服务带来的行业价值。这是为什么呢?

从一个TiDB数据库用户应用的全生命周期来分析,大多数用户都是先下载免费版,尝试到社区里获得简单的技术支持,然后逐步开始更多的应用落地,随着应用的深入,自然首先想到与PingCAP数据库团队建立面对面的连接,以此获得更多专业化的原厂技术服务与支持。其中包括共同研讨解决方案,不断深化数据库应用,排除技术故障,扩展更广泛的应用场景,培养用户自有的人才团队,构建技术创新团队等涉及数据库应用全生命周期每一个环节的持续跟踪。

全球云观察分析认为,Ti-Star生态计划的真正目的,就是为企业用户和社区用户实现真实场景落地,通过双方或多方共创共建,让用户享受到企业级开源分布式数据库持续创新的长期成果。从另一个侧面来看,彰显了TiDB在数据库应用上更贴近用户业务创新,更接地气的现实意义与价值。

特别值得一提的是,在2020年6月,PingCAP在海外区域推出了TiDB Cloud,致力于打造更安全、更可用、更开放的全托管式数据库即服务产品,通过有限预览的方式,让一部分需求强烈的用户先用起来。

当然,面向混合多云时代的发展大趋势,TiDB Cloud也将成为新利器。经过一年左右时间持续不断的技术演进与功能丰富,TiDB Cloud的可用性、安全性、弹性运维得以进一步增强,PingCAP宣布在2021年第三季度支持多云多区域的数据同步。意味用户数据库的异地灾备变得更为简便容易,这是云时代下许多企业用户在数据库应用方面的一个短板,但PingCAP从数据库角度以数据平台的思路将其补上了。

此外,在2021年第四季度,将推出TiDB Cloud Free Tier个人开发者免费集群,对个人开发者开放免费使用TiDB、TiKV、PD (Placement Driver)、TiFlash 节点,体验和测试TiDB对MySQL的良好兼容性,在云端体验HTAP的强大创新功能,感受实时分析带来的时间节省和效率提升。

从TiDB的社区版到企业版再到TiDB Cloud的不断成熟与完善,再次让业界认识到企业级开源数据库的功能演进与技术创新的过程,必然是源自用户真实场景应用,以及开发者最直接的反馈。

相信开放的力量,做时间的朋友,把TiDB的价值交到全球每一位开发者手中,让用户在任意地方、任意规模上,享受到OLTP规模化和Real-Time HTAP的能力。

PingCAP也将携手更多的用户、更多的开发者,拥抱创新,共同创造统一、简化的体验,构建一个可生长的开放混合生态。

  • 在PingCAP DevCon大会展区,合作伙伴神州数码的展位现场,吸引了一位少年开发者的关注。

打磨,破圈,释放开放的力量,在这六年左右的时间里,PingCAP做对了这些事情。

TiDB是中国的,也是世界的。通过中国用户极端场景与应用的打磨,为全球用户提供企业级开源数据库及服务。从中国走向全球,TiDB也开创了中国数据库厂商前所未有的新格局。

开放,不仅成就了TiDB,也成就了打破企业级数据库市场传统技术壁垒的PingCAP,成就了一个数字时代的新未来。

(by Aming)

- END-

欢迎文末留言评论!

【全球云观察】本文和作者回复仅代表个人观点,不构成任何投资建议。

阿明观察
科技观点、人物观察、新闻评论。

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)