数据库产业正在中国市场开启新机遇。
在近日的openGauss Summit峰会上,调研机构弗若斯特沙利文发布的《重点行业数据库应用调研报告》指出,openGauss系在2023年中国数据库市场线下集中式新增市场份额达21.9%,已规模应用于金融、政府、电信、能源、制造、公路水运、邮政、教育等十大关键行业核心场景。这意味着openGauss已跨越生态拐点,正式踏入生态发展期。
追溯来看,华为在多年研发Gauss高斯数据库(GaussDB)的基础上进行开源,形成了OpenGauss社区。社区作为中立的开源产业组织,如今也聚集了更多的开发者,生态进一步壮大。
openGauss社区理事会理事长胡正策向记者介绍道:“openGauss开源三年多,社区企业数增长100倍,开源贡献者增长50倍,版本下载量增加38倍,代码量增长16倍,从2020年6月开源的130万行代码发展到今天已经2100万行,从Gittee平台指数看,openGauss已经成为国内最活跃的开源数据库根社区,从拓展期正式进入快速发展期。”
这是近年来国内数据库产业发展的一个缩影,近年科技博弈之下,数据库作为重要基础软件之一更加受到关注。国内的科技巨头们也纷纷加大投入力度,华为、腾讯、阿里等都强化了数据库的研发,并积极加码开源。
从国内数据也能看到新兴力量的崛起。沙利文咨询合伙人兼董事总经理杨晓骋谈道:“数据库在中国还是处于一个自主研发起步阶段。但是从国家‘十四五’计划提出要大力发展数据库以来,数据库在中国蓬勃发展。从市场份额来看,从2019年35%左右的国产化,一直到2022年年底,整体国产化的比例已超过了50%。”
从全球来看,Oracle等国际巨头是老牌的数据库龙头,当前国内厂商们也在通过创新进行差异化突围,进一步攀越技术、生态、商用的“高山”。
openGauss生态进展几何
对于数据库的重要性,中国计算机学会常务理事、华东师范大学数据学院教授周傲英谈到,数据已经从数据库时代的“副产品”变成了现在的“新要素”,建设数据基础设施的目的就是为了更好释放数据的价值,这是中国数据库的机遇。同时他也指出,“替代工程”只是契机,“升级换代”才是趋势。
而在开源数据库的激烈竞争中,openGauss是典型代表,它与其他社区有一些本质区别。
胡正策在接受21世纪经济报道等媒体采访时谈道:“首先openGauss社区主要以发展产业生态为主,其他的开源数据库主要发展产品生态。华为本身在线下不做自己的数据库产品,而是支持伙伴来打造商业发行版、支持行业客户打造自用版,而其他的数据库厂商最终要回归到自己的商业版的价值闭环里。”
他还表示,数据库被称为“软件工业上的明珠”,从硬件到操作系统,再到上层的编译器、编译语言,是软件工程全栈技术集大成者。而华为作为openGauss主要贡献者之一,有全产品线体系,包括存储、计算、网络等,这使得openGauss能够充分利用华为30多年的积累形成一流产品。
然而基于同一个开源社区,各个开发版本如何保持差异化、避免同质化十分关键。
对此,北京海量数据技术股份有限公司总裁肖枫向记者分析道,差异化主要体现在安全可控、企业特性以及整个生态的适配与合作等方面。比如在适配上,“一个好的数据库生态很重要,它包括上游、下游,跟所有的CPU、操作系统的融合,不是简单适配,我们和麒麟、统信联合攻关做了很多专项上面的优化。”肖枫说道。
此外,他还表示,在加入openGauss社区前,行业可能面临MySQL等国外数据库带来的一些协议安全性上的问题,而openGauss创造了全国产的开源环境,极大程度上消除了安全方面的隐忧。
经过三年的沉淀,目前openGauss系数据库已成功装机超过6万套,呈现出加速增长趋势,并广泛应用于政府、金融、运营商、互联网、电力等多个领域的核心系统。背后是openGauss社区的6100多名核心贡献者和全球版本下载量超过230万的支撑。
对于和openGauss的合作,云和恩墨创始人兼总经理盖国强谈道:“这是第一次我们有机会把所学的数据库知识放在中国的一个社区里让它生根发芽,还能够茁壮成长,在不断的积累之上,我们希望能够产生中国数据库的原始创新,而不是微创新。只有将openGauss用到真正的核心系统,我们的数据库产业才叫成功,经过三年的时间,我们的应用从外围到核心,这是巨大的进步。”
国产数据库建设的加速和挑战
数据库的成长并非易事,软件生态需要长期和巨大的投资。华为鲲鹏计算业务总裁李义谈道了这一现实问题:“中国做数据库的厂家非常多,也很复杂,投入也很大。目前为止,中国市场上做数据库的厂家中,年收入营业额超过50亿的几乎没有,投入见效非常慢。”
他也表示,华为开源就是和产业界共同打造满足企业要求的“高性能、高可用、高智能、安全可信”开源数据库,未来华为也将持续加大投入,共建根社区,推动全产业链的数据库创新。
尽管生态复杂,但是从数据看,国内数据库整体已经有了好的起步,国产应用份额在不断提升。
据杨晓骋介绍,目前国内有四个主要应用场景,分别是金融、电信、政务和制造业,四大核心场景在中国数据库市场规模里占到70%,国产化占比达到40%以上。其中,政务领域已经达到 53%,金融的国产数据库比例达到48.5%。
与此同时,杨晓骋也指出:“国产的厂商更多还是集中在一般数据库,应用到核心数据库的比例虽然过去几年大幅增长,目前可能达到20%左右的水平,未来还有非常大的发展空间。”
可以看到,国内的数据库发展仍面临着不小的挑战,除了核心应用场景还需要进一步突破之外,还有技术、生态等方面的课题。
中国软件行业协会产业研究部主任宋贺鹏表示:“我国目前有将近300家企业在从事数据库的产品工作,其中有超过半数的企业存在着套牌和伪资源的情况,技术收敛势在必行。其次,数据库产品也要考虑客户的需求,口碑才是检验产品的终极体验。此外,从技术层面数据库资源池化构架已经成为未来的主流方向。没有说开源一定是发展国产数据库的唯一途径,但是在当前阶段这是我们的最优选择。”
在国家工业信息安全发展研究中心软件所所长潘妍看来,数据库是基础软件三驾马车之一,近年国内数据库产业显著提升,“同时也应当看到面向更大规模、更复杂应用场景的需求,要达到好用的技术水平,实现可复制、可推广国产数据库,还面临着大量的技术攻关、产业生态优化、应用协同等方面的难题。大而不强,多而不优的局面还没有得到根本性的改变,还需要进一步提升。”
她还提到对未来产业发展的建议,包括加强核心技术攻关,壮大根社区的生态,打造优质的骨干企业,形成多层次梯队化的创新主体和合理的产业布局,完善公共服务体系建立相应的标准体系等。