中国联通是国内三大电信运营商之一,其历史可以追溯到1994年,作为国有企业的代表,中国联通一直在通信行业扮演着重要的角色。而数据库作为数字基础设施的根技术,是中国联通在大计算战略中的重要投入方向。
2022年,中国联通正式加入openGauss社区,完成了MySQL协议兼容,以及36个语法兼容点的开发,已贡献给社区近万行代码,并基于openGauss发布了自主发行版CUDB(China Unicom DataBase)。联通云数据库产品线也因此增加了一位新成员:CUDB云数据库(单机和主备架构版本均已上线联通云)。
近日,我有幸专访到了联通云数据库产品研发专业总监柴鹏,深入了解联通云数据库产品线及与openGauss背后的故事。
在专访中,柴鹏表示,CUDB的高性能、可用性、可靠性、安全性得到了验证,已在联通内部多个系统平台进行了替换应用,实施了Oracle和MySQL数据库近百TB存量数据到CUDB的迁移工作。同时,柴鹏还分享了联通云数据库的优势与未来发展规划,让我们一起来看看!
自主研发做云,数据库是基本盘
大约在6年前,我曾写过一篇《DTCC大会归来,为何云计算厂商都在搞数据库?》的文章。文章中,我谈到云计算与数据库之间密不可分的关系。云计算厂商活跃在数据库的舞台上,看似跨界,背后是必然,因为,做云计算如果没有自主的数据库产品,只能等待被收割或被挤出市场。
据三大运营商2022年财报数据,联通云、移动云和电信云的的业务收入增速均超过100%,这一数字充分展示了三大运营商在云业务方面的发展速度之快。
然而,更为引人瞩目的是,8月9日,中国联通宣布其2023年上半年业绩,联通云实现收入255亿元,同比飙升36%,而这个数字仅是一个起点,全年的收入目标更是超过500亿元。 而随着云规模的持续增长,数据库所扮演的角色也将愈发重要。
倘若云计算厂商没有自主研发的数据库产品,而只能依赖开源数据库来提供服务,那么,将会面临何种局面?对此,柴鹏提出了自己的观点。他说,拥有自主数据库对于云厂商而言,具有战略意义。如果云厂商完全仰赖开源数据库,一旦某天这些开源数据库的许可协议发生变化(有些产品已经发生)要求付费使用,那么,这笔费用由谁来承担?用户还是厂商?无论哪种选择,都是不轻松的。后续的升级维护也可能被卡脖子。
通过研发自己的数据库产品,云计算厂商可以获得更大的自主性,以应对潜在的开源许可变化,同时也可以更好更及时地满足用户需求。此外,自主的数据库产品还可以为云计算厂商带来更多的竞争优势和收入机会。
联通云,作为国家队的核心成员,深刻理解自主研发的重要性,在包含数据库在内的基础软件领域,自主研发已成为当务之急。
奇妙探索
联通云与openGauss共建生态
在数据库领域, 联通云与 openGauss 的合作引发广泛关注。然而,究竟是什么原因让联通云选择了openGauss作为打造CUDB数据库的基石,而非其他国内开源数据库,或自主研发一个全新数据库呢?
在众多国内开源数据库中,openGauss凭借其优秀的生态和活跃的社区脱颖而出。截止目前,有近360家企业加入openGauss社区,下载量达到210万,覆盖113个国家的1512个城市。开发者数量增至5000人,代码总行数增至1500万行,产生问题超过12,000个,提交的拉取请求(PR)超过13,100个,评论数高达218.7K+。这些数据展示了openGauss生态系统的强大,以及其在推动市场份额增长上的重要作用。
柴鹏说,在云计算领域,包括数据库在内的基础软件如果依赖外部厂商,容易失去自主性和被收割,也不利于快速响应用户需求和保护数据安全,所以一定要自研。而性价比最高的自研路径是基于开源,根据用户需求和自身目标进行迭代。出于降低风险的考虑,我们把选择范围聚焦在了国内开源协议友好的社区。艾瑞数据报告显示,中国数据库市场由两部分组成:存量市场和增量市场,国产替代主要在存量市场展开,以替换海外集中式数据库为主,因此,选择对象对传统集中式数据库的兼容性及功能上要有优势,另外,未来全国内化环境也会越来越多,所以,针对主流国内环境的性能优化也很重要。再分析生态兼容、社区活跃度、研发实力等因素,我们最终选择了openGauss社区。
国内数据库的难点不仅是在研发,更是在生态建设。后起数据库提升生态位的最高效方式之一就是开源。而openGauss 是国内数据库的独特存在,华为为openGauss单独成立一个部门,这个部门以做好生态为唯一目标,没有商业KPI,也不做商业发行版,这一独特的发展模式为包括联通云在内的广大国内数据库厂商提供了合作的机会。可见,openGauss确实想发展生态,其开源是最有诚意的。与其合作,意味着不仅能节省高昂的从头造轮子的成本,也能迅速产品化,更快地满足内外用户需求,为云业务增长提供坚实支撑。
活跃的社区和融洽的合作氛围,让各方能够共同探讨问题、共同开发项目,从中汲取了对产品的更深了解。柴鹏说,参与社区研发项目可为生态发展贡献一份力量、社区SIG组的技术方案讨论可保证我们研发的思路少走弯路、社区专业的测试体系也可保证我们提交代码的质量。联通云已向社区贡献近万行代码,正在online DDL和基于存储池化的多写等领域与社区展开研发合作。推出CUDB的过程充满了挑战,但通过自主研发与社区合作,问题一个接一个被解决,在此过程中既熟悉了内核代码,也磨炼了研发队伍,研发能力也得到了业界的认可。
在技术交流方面,openGauss社区提供了丰富的活动,如开发者大会和各种峰会,为不同厂家和业者提供了广泛交流的平台。与此同时,产品技术展示也成为社区的重要一环,通过展示,不仅让更多人了解到联通云的产品,还进一步扩大了影响力。
自从加入openGauss社区以来,联通云数据库团队积极参与社区建设与发展。团队中不仅有理事会成员和品牌宣传委员会委员,还拥有多名committer,他们在社区的各个SIG组会议上积极参与,为社区的发展贡献了核心代码。联通云还与鲲鹏展开深入合作,共同开发存储池化多写和uwal复制加速等功能,从而不断提升其在社区中的参与度和技术影响力。
正是因为对openGauss社区做出的卓越贡献,2022年,联通云获得了优秀SIG组奖。此外,联通高级数据库内核研发工程师赵俊也因其对openGauss社区的杰出贡献,获得了优秀开发者奖项。
这已经不仅是合作的故事,更是奇妙共生探索旅程。CUDB与openGauss的共建生态之路,不仅带来了技术的革新,更彰显出社区合作和开发的重要性。
未来展望
引领云原生数据库新征程
展望未来,联通云将继续在数据库核心领域展开探索,深耕自主研发,融汇技术积累与创新精神,积极追赶业界头部产品,丰富功能,降低成本,安全可靠,更好的为用户服务。
在技术方向上,联通云将聚焦于多写架构下的Logisdatabase,优化存储池化架构的写性能;支持MPP和HTAP应用场景,充分发挥多节点算力,提升复杂查询的性能;丰富联通云DMS,DTS等生态工具,为用户提供更好的数据库使用体验。同时,联通云也积极推进云数据库的Serverless化,为用户提供弹性灵活省钱的算力服务。
截止目前,CUDB数据库已迎来2.0版本,成功应用于联通内部多个关键业务领域,CUDB和联通云其它数据库产品一样,拥有丰富的全生命周期管理服务,此外,openGauss社区的任何更新都会定期在CUDB新版本上同步,用户可以享受openGauss和CUDB最新的研发成果。柴鹏说。
柴鹏深信,国内数据库市场正在向着本土自主与云上变革的方向迈进,而openGauss定会在这国内开源舞台上,持续壮大其存在,赋予更多功能与性能,不断提升用户满意度与使用率。他期盼与openGauss社区继续紧密携手,进一步发展性能与功能,借助强大的生态系统,吸引更多热爱者,在国内开源数据库市场中赢得一席之地。
最后,柴鹏还透露,联通云正在与社区合作开发新版本,特别是在数据分析等领域进行合作,以增强产品竞争力。并且联通云将进行不同版本的开发,包括OLTP、OLAP、HTAP版本。此外,联通云还与社区合作开发新版本,联合研发核心功能,以提升产品性能和适用性。联通云数据库的关键优势,是多年积累下的客户信任、安全和成本控制,可帮助用户应对未来潜在的国际不确定性风险和数据安全问题。
今年,openGauss Developer Day 2023大会上的一则预测引起了我的关注。openGauss社区理事会理事长江大勇预计,2023年,openGauss在非云集中式场景的市场份额有望突破20%,实现生态转折。
此前,openGauss从未透露过市场份额数据,这一全新预测背后有着怎样的支撑?底气何在?我想,此次对联通云的采访,柴鹏道出了其中的一丝玄机。