构建数据库生态系统正当时

2024年 1月 10日 44.5k 0

高德纳(Gartner)
报告表示,数据库自成孤岛的时代已经结束。云数据库成为“更广泛的数据生态系统”一部分的强烈信号正在不断增强。上个月,分析小组对顶级数据库的生态系统参与度进行了评级,结果可能会让你大吃一惊。

去年12月中旬,Gartner发布了《2023年云数据库管理系统(CDBMS)魔力象限》报告,分析了在公共云和私有云中运行的事务性和分析性数据库的市场。19家云DBMS供应商最终进入了这个象限,该象限由AWS、微软Azure、谷歌云和甲骨文等公司主导。

Gartner分析师确定的一个主要趋势是,标准数据库的特性和功能与更广泛的数据管理工具市场提供的特性和功能混合在一起,而这些特性和功能传统上不属于DBMS本身。

过去,数据库客户通常求助于独立软件供应商(ISV)来实现数据管理功能,如数据沿袭跟踪、数据治理、数据集成/ETL、数据质量和数据安全。这些功能中的许多都被集中到所谓的数据结构中,以确保各种数据管理过程中的可重复性和一致性。

2023云DBMS的魔力象限(Magic Quadrant;来源:Gartner)2023云DBMS的魔力象限(Magic Quadrant;来源:Gartner)

但据Gartner的分析师称,数据库供应商正在与数据管理独立软件开发商进行更密切的合作,反之亦然。作为数据栈中最重要的一层,数据库能够很好地(或者更好地)与其他重要的数据管理产品组合在一起,这是一件很棒的事情,公司必须依赖这些产品才能从数据中获得价值,同时将成本和风险降到最低。

虽然不是所有的DBMS供应商都以同样的程度或方式与ISV合作,但根据Gartner的说法,DBMS在数据生态系统中的作用是一个明显的趋势。

Gartner写道:“云DBMS系统已经开始意识到周围的其他数据管理组件,并与之协作。这并不意味着云DBMS系统将包含其他系统的功能。相反,他们会意识到这些问题,并通过与它们交互来增加更多价值。”

Gartner表示,云DBMS参与到更广泛的数据生态系统中,“在能力上有了重大的改进”,并“有意识地与它们进行互操作”。“如果说有什么不同的话,那就是这方面的进展比预期的要快,自去年的云DBMS魔力象限以来,有许多重要的供应商发布了公告。”

在数据生态系统中发挥作用的趋势是一个更广泛的趋势,而不是孤立于云DBMS或一般DBMS(早在2019年,Gartner预测云将篡夺大部分DBMS市场,这是正在发生的过程——Gartner表示,2022年55%的DBMS支出在云上,云占整个DBMS市场增长的98%)。

Gartner表示,到2025年,90%的新数据和分析部署“将通过一个既定的数据生态系统,导致整个数据和分析市场的整合。”更重要的是,到明年年底,55%的IT买家将采用数据生态系统。该分析集团表示:“这将整合40%的供应商格局,从而降低成本,同时减少选择。”

Gartner对一些云DBMS在数据生态系统中的参与给予了更高的评价:

Gartner表示,阿里云最近与MongoDB、ClickHouse和PingCAP等ISV建立了合作关系,这表明其云生态系统得到了改善。Gartner在其魔力象限中表示:“这为第三方数据和分析解决方案提供了更多选择,同时减少了与阿里云的集成工作。”魔力象限将阿里云列为领导者象限。

Gartner还讨论了亚马逊(AWS)向数据生态系统的转变。报告指出,这家云计算巨头拥有强大资源,“可以在DataZone的基础上,向更加集成的解决方案迈进”。亚马逊DataZone是一项数据管理服务,于去年10月上市,由数据门户、数据目录、数据项目和环境以及治理和访问控制层组成。然而,Gartner也警告说,不要采用全AWS生态系统,这会引发依赖锁定问题。

Cloudera因其数据生态系统的工作而获得高分,被Gartner列入其远见者象限“Cloudera继续投资于其开源领导地位,通过其数据生态系统中的开放标准推动社区创新,在所有云数据架构中提供便携式数据和人工智能服务。”“通过在所有云和内部部署的集中控制平面,它提供了集成的安全性、元数据和治理,具有应用的可观察性和开放的数据生态系统。”

云提供商提供的生态系统比Cloudera的“集成更紧密”,“更容易使用”。然而,Cloudera致力于多云和混合部署,以及工作负载的可移植性,“是对这种竞争压力的有效平衡,这种压力需要持续努力才能保持有效性。”Gartner表示。

Couchbase开发的NoSQL数据库主要用于交易和操作用例,其在移动和边缘领域的能力以及其托管数据库服务Capella的易用性受到了Gartner的称赞。然而,根据Gartner的调查,Couchbase缺乏生态系统的支持,它将Couchbase置于利基玩家象限。

该分析机构表示:“Couchbase并不具备访问数据的成熟能力,也不具备向Couchbase世界以外的引擎提供数据的能力,尽管它们在Couchbase的路线图上。”“在生态系统中与多个引擎进行广泛交互的能力正在推动多种用例的灵活性和效率提高,最突出的是分析和人工智能。其他非关系型产品也有这种限制。”

被Gartner列为领导者象限的Databricks,其在Unity Catalog上获得了高分,Unity
Catalog是Databricks的元数据目录和治理中心,适用于Databricks和外部存储库中的数据。Gartner还赞扬了Delta Live
Tables的数据生态系统,因为它能够简化流、批处理和人工智能工作负载的ETL管道开发。

Gartner对谷歌云的数据生态系统参与也有好评,谷歌云也在领导者象限中推出。Gartner特别赞扬了Dataplex,它的元数据/治理层使数据生态系统更加紧密集成。

微软在领导者象限中也获得了高分,因为它愿意让自己的数据库更加开放,并与其他微软产品(包括Microsoft 365、Power
BI和Purview)合作,但也愿意与独立软件开发商(ISV)的外部解决方案合作。

“这为客户带来了更加一致的体验。”“与此同时,微软Fabric为非微软系统中的数据带来了更多的开放性,这有可能减少其客户对供应商依赖锁定的担忧。”然而,一些微软客户对微软DBMS生态系统功能的复杂性表示担忧,这会损害性能、安全性和成本控制。

SAP是Gartner魔力象限中的远见者,因其在同一HANA数据库中运行运营和分析工作负载的能力而受到称赞。Gartner也很喜欢SAP
Datasphere在生态系统中统一SAP和非SAP数据的能力。

“SAP现在通过文件交换、复制和联合在SAP和非SAP环境之间导入和导出数据的能力更加开放,”Gartner表示。不过很少有非SAP客户会使用SAP来管理数据。Datasphere很可能被“拥有重要SAP技术”的客户所使用。

Snowflake开发了一个分析数据仓库,位于领导者象限,也因其“强大”的生态系统能力获得了Gartner的认可。“Snowflake推广了一种易于使用的集成解决方案的理念,辅以强大的数据共享和数据市场故事。”

Teradata是数据生态系统中的另一个数据仓库提供商。将Teradata置于远见象限的Gartner喜欢Teradata的QueryGrid功能,该功能“通过智能地在适当的地方下推处理,卸载Teradata机器的周期,并减少必须返回Teradata的数据量,从而有效地实现对Teradata外部数据的访问。”Gartner表示。

云DBMS显然具有与第三方数据管理工具和更广泛的数据生态系统集成之外的功能。但正如Gartner所显示的,数据库的生态系统等级正成为数据库购买者更重要的考虑因素。

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论