近期参加了于北京召开的 DTC 2024 大会。作为数据库行业内的技术盛会,会议吸引了大量厂商与企业用户的参与。个人作为主持人也参与了金融专场的分享,并于线下与很多同业做了大量交流。感觉整体行业还是呈现较以往不同的一些特点,本文就从行业、技术、产品角度谈谈个人的感受。
1. DTC 大会观察:行业篇
❖ 行业发展,喜忧参半
数据库行业,特别是国产数据库行业近些年来发展迅猛,但在迅猛之余也存在不少隐患。来自阳博士的分享中就谈到了国产数据库在全球与国内发展的一些现状。一方面,国内数据库厂商产品众多,具不完全统计有超过300余家的厂商产品,仅关系型数据库就有180多家。但从市场规模来看,国内的数据库市场空间仅占全球不到8%的市场。在如此规模有限市场空间下,众多厂商如何良性发展,值得关注。这其中需要考虑社会化资源最最优化分配问题,防止低效竞争导致的资源浪费。此外,全行业的不景气也影响到数据库行业,自己本人也做ToB的创业,深有此感。在如此大环境下如何做好战略规划、产品定位、运营策略等,对于企业发展尤为关键,也是真正考验着企业管理者。
❖ 自主能力,成为关键
近些行业内一些关于开源套壳的讨论,尤为引人关注。在本次大会上,也有很多企业将自主可控能力,作为重点的宣传方向。诸如根技术等理念被反复提及,具有完整知识产权和核心源代码的技术可控能力,是保证国家关键信息安全的基础。这一现象的背后,是有着内外部复杂环境所造成的。个人观点是,不能将是否是开源套壳这一形式作为判断自主能力的标准,还是回归初心,从企业是否具备核心代码的掌控能力上加以判断。去年引人瞩目的国测中,就包含对代码掌控的评判测试,正是基于这方面的考虑。当然,如果企业采用基于开源构建自有产品的方式,还是要重视相关法律、合规风险,构建自有的知识产权体系,为未来在更广阔的国际领域发展,做好必要的准备。
❖ 降本增效,客户刚需
如果你今天接触客户,几乎所有的客户都有降本增效的需求,这也成为一款产品是否吸引用户的必要条件。因此我们也看到很多厂商产品在降本增效方面做足了工夫,诸如资源池化、数据库缓存一体化、存储压缩、租户隔离、多模多态、混合负载等等一系列技术都在为降本增效这一大前提服务。从我实际接触客户上,也深刻感受到这一点。在前期接触众多产品差不多的情况,一两个降本增效的杀手锏功能,很可能最终赢得客户。
❖ 多场景化,成为趋势
多场景化是指,用户不再为某一类场景单独选择一套技术产品与方案,而是希望通过一套技术栈可满足对多种业务常见的需求。这一诉求主要是基于成本、管理等综合因素的考虑。于是乎如流批一体、融合引擎、流式分析、混合负载等技术,正是为了迎合这一趋势。以流式分析为例,之前这往往是大数据的一个概念,但今天我们看有厂商已开始在数据库中集成这一能力,一改传统数据库被动响应的工作方式,为用户提供流式分析+实时告警的流处理能力。这对于用户而言,一方面可以在如运营数据分析等场景使用数据库来解决,多了一种选项方案;一方面也简化的开发处理逻辑,无需编写程序仅通过SQL方式就可以定义流处理管道逻辑,降低研发成本与风险。
❖ 落地艰难,任重道远
随着国产数据库加速步入深水区,这一过程也开始呈现诸多难点。来自大会上的一篇分享颇令人深思,标题就是《从技术的难,到业务的忧》。如果在选择国产数据库这一过程中,做到迁移不焦虑、应用改动少、性能不降低、数据不丢失。也许看起来这些是对数据库的最基本要求,但也正是这些成为目前用户落地国产库的艰难所在。本人也主持了金融分论坛,在论坛上很多老师都分享了使用国产数据库的坑或者是使用国产库的那些技巧,这些无疑都是在一线实践中得来的宝贵经验。从厂商角度来看,也都非常重视这一点,通过外围生态工具去解决迁移评估、流量切换、数据迁移等难点;通过核心优化去解决运行不稳定、高可用与容灾等问题;通过行业解决方案,有针对性对各行业、不同业务场景结合实践推出最优路径,方便用户落地。
2. DTC 大会观察:技术篇
❖ 数据多模与多模融合
从数据模型来看,一方面从关系型、键值、时序、文档、图等逐步丰富,越来越多的数据模型被人们所用到,于是一大批专用数据库纷纷涌现;另一方面数据库开始出现融合态势,即在一款数据库中支持多种模型的存储与计算。从前者来看,这是数据使用发展的必然趋势,随着人们对数据越来越重视,数据必将更多为发掘使用产生价值;而后者的趋势,也是人们面对这一复杂现状,希望得到一种“单一简化”的方式去解决。个人觉得专用与融合方向路线还将长期存在。
❖ AI与DB之协同、驱动
人工智能与数据库存在非常紧密的关系。一方面人工智能需要大量的数据支持,而数据库就承载着存储与管理数据的职能,没有数据库提供的数据,人工智能就如无源之水;另一方面人们非常习惯于通过数据库方式-SQL与数据打交道,可以轻松的获得并使用数据,而这对于人工智能非常重要,可以大大降低数据使用成本。可以说两者可以亲密协同,为用户承担起管好、用好数据的职能。
从第二个大的方面来看,随着数据库自身越来越复杂,从自身管理到用户使用都面临复杂度大幅提升问题。人工智能的出现可以有效解决这一问题,于是从数据库的自治管理、诊断优化、故障分析到数据新交互方式等无疑都是这一方面的体现。人工智能驱动下的数据库,成为必然一种选择。随着这些年来,越来越多的数据库及生态工具集成进 AI 能力,其产生的价值开始凸显,未来必将成为厂商竞争的高地。
❖ 无法回避的热点-向量
去年最火的技术名词就是大模型,随之而来的就是向量得到了更多的关注。一方面人们希望对这种新的数据计算模型的支持,一方面也对算力本身提出了更高的要求。于是乎数据库领域的新兵-向量数据库得到更多关注,同时传统关系型数据库已逐渐为向量计算提供相应的能力。对于前者,我们从资本层面得到的明显的印证,一批企业纷纷达到融资;后者来看正有更多的传统库支持了向量,会上更是有厂商表达全线产品已接入向量化能力。个人从长期角度来看,这两者不会相互取代,而是会在不同场景下各自发挥的各自的优势。从国内市场来看,向量与发展与整个AI生态发展紧密相连,目前还处于早期探索阶段,商业化场景并不清晰,也还没有头部玩家出现。
❖ 打造端到端的安全体系
随着一系列安全法规的出台,人们对安全特别是数据安全日益关注。作为数据的主要载体之一,数据库对于安全能力的支持成为必然。与往年有所区别的是,今年大会对于数据安全体系建设被更多提及。从数据的外层感知防御、到中层访问控制、到内层加密保护、再到事后审计追踪,构建起以数据为中心的全访问数据安全防护体系。这其中包含了从异常行为分析、敏感数据识别、认证鉴权、三权分立、数据加密、动态脱敏、防篡改、细粒度审计等等技术。某厂商总结的非常好,要做到“攻不破、进不来、拿不走、看不懂、改不了、赖不掉、信得过”,只有这样用户才能放心大胆使用。
❖ 资源架构升级之池化架构
资源池化的概念,最早是从云厂商带来的。云作为一种新的资源供给方式,可以将底层资源抽象后进行供给。随着更多更细粒度的底层资源被池化处理,带来的是高弹性与低成本。这一概念,正在被数据库领域借鉴。一方面基于云资源池化的云数据库产品经过多代演进,正向着Serverless化发展;另一方面数据库作为资源消耗大户,自身也面临利用率低下、多负载差异、多模型融合的难点,对底层资源要求促使其想池化领域发展。其实最早对这一概念的基础,更多是来自 Oracle PDB,现在正看到越来越多的数据库产品开始在此方向发力。
❖ 一条艰难的捷径之兼容性
国产数据库产品,想要取得突破,良好的生态是必须,而这一过程往往需要长时间的积累与建设。而想考虑走一条捷径,兼容性是最容易想到的策略。这也是国产数据库很多都在兼容性领域投入重兵的原因之一。然而要想做到“完美”的兼容性是几乎不可能的,这其中需要大量的兼容适配工作。本次大会上就有多家厂商展示其兼容性能力,确实投入了大量精力。如何看待这一现象呢?主要还是因为自有生态的建设需要过长的时间,在窗口期不长的情况下兼容性成为迫于无奈的一种选择。行业内对此有着多种声音,有的是希望厂商多多兼容,简化用户迁移降低改造成本;也有一种声音是希望弱化此投入,更多建立基于开源或自有的生态标准,鼓励用户从根本解决依赖问题,避免重蹈生态依赖的覆辙。个人觉得这不是一个是非问题,企业可根据自己产品定位与发展选择道路。
3. DTC 大会观察:运营篇
❖ 体系化建设渐成标准
此次大会给我突出印象,就是企业开始越来越重视产品体系化建设。打开很多厂商产品册子,往往突出位置就是企业的产品大图。通常是以架构或场景区分的多款数据库产品为核心,外围配套有生态工具,覆盖从迁移、管理、开发、备份、优化等多领域,上层是以多行业解决方案进行支撑,最外围是众多合作伙伴。可以说国内数据库厂商经过多年发展,已经开始从单一产品竞争,逐步演进到全生态的比拼之中。厂商在产品版图构建上,不能有明显的短板,否则很可能成为客户不选择的理由。从客户角度来看,这是一个好事情,可以选择到覆盖全面的产品;但从另一个角度来看,也拉高了企业竞争门槛,对于很多初创型、中小企业来讲构成不小的竞争壁垒。
❖ 从“我是谁”到“我为谁”
如前面所讲,国产数据库有数百家之多,关系型数据库就有近200家。如此众多的厂商产品充斥在市场中,用户如何选择成为难点。如何在众多产品中脱颖而出,是很多厂商市场运营策略需要考虑的。在会场上也跟部分企业做了交流,觉得这个方面还稍显不足。很多企业还是从“自我宣传”角度来讲述产品,给用户一种大而全感觉的同时,似乎又抓不住重点。也许一天下来,用户能真正记住的并没有几家。这其中需要做个观念的转变就是从“我是谁”转变为“我为谁”,即从以自我为中心的视角,切换到以用户为中心的视角。从讲述产品功能、厂商资质等,转变到以讲述场景价值为核心,形成从“场景-价值-功能-技术-实力”的表述方式。俗话说,一招鲜吃遍天,通过接触到很多客户有明显感知,其实用户对产品都有着清晰的认知,这些buy in的点正是需要厂商反复强化,形成业内共识进而达到运营效果。