国产数据库探索多领域技术突破海外竞争力亟需增强
2023年下半年,数据库行业有了一些新的发展特点,特别是国产厂商成为了发展主力。经过多年发展,国产数据库推广进入“深水区”,并取得不俗成绩。
从技术角度上看,国内数据库产品在多模向量、智能运维、云与云原生、数据库兼容等技术上取得了不少突破,并开始在用户落地上取得一定成果。在分布式数据库领域,一方面产品规模化落地并开始输出行业经验,加速实践过程;一方面以HTAP、多模等特性为代表,极大丰富了分布式数据库场景。同时我们也看到,国内集中式数据库领域取得了一定突破,这一架构产品逐步成熟可实现更为平滑的替代,成为部分国内用户的首选。以图、时序、向量等为代表的异构模型数据库产品开始受到更多关注,传统数据库中也开始更多支持如JSON等类型,场景化落地成为此类技术发展要点。上半年大火的ChatGPT,也开始以自主SQL生成、智能优化等功能形式在更多国内数据库产品中落地。在数据分析领域,湖仓一体、融合型数仓发展快速,也成为资本方关注热点。此外,数据安全、软硬结合、数据治理等方面也有不小的进步。
从市场角度上看,国内数据库厂商竞争加剧,头部厂商你追我赶、并驾齐驱,一些新兴厂商崭露头角、快速提高。这也从侧面印证了国内数据库行业呈现加速洗牌态势,相信未来会有一批厂商及产品经过大浪淘沙,站稳脚跟获得用户认可。从近期国内第一次推出自己的象限分析来看,头部厂商聚集现象明显,这些已成为企业支撑业务的首选。在云与云原生领域,国内云数据库产品竞争呈现白热化。今年部分厂商产品大打价格战,希望以此在国内云市场领域占据更大份额。但从国际市场来看,国内企业还处于相对滞后状态,在今年国际权威的云数据库象限分析中,多家企业已退出报告主体,仅在荣誉榜单中被提及。在这方面国内产品还需要奋起直追,从低层次的价格战尽快回归到产品能力本身,同时加速在海外布局,充分参与到全球竞争之中。
数据库产品半年度盘点
主流数据库的版本升级与更新亮点
dbaplus社群携手一众数据库行业专家,汇总、梳理并提炼出主流数据库近半年的版本更迭、性能优化、功能提升等关键信息,希望对大家了解数据库发展趋势,以及数据库选型工作有所帮助和启发。
DB-Engines数据库排行榜
以下取自2023年12月的数据,具体信息可以参考http://db-engines.com/en/ranking/,数据仅供参考。
图片
DB-Engines排名的数据依据5个不同的因素:
- Google以及Bing搜索引擎的关键字搜索数量
- Google Trends的搜索数量
- Indeed网站中的职位搜索量
- LinkedIn中提到关键字的个人资料数
- Stackoverflow上相关的问题和关注者数
RDBMS
Oracle 2023下半年重大事件及技术更新
- Oracle Database 23c已在OCI Oracle Base数据库服务上全面可用。
- Oracle Database 19c企业版(Oracle数据库当前的长期支持版本)已通过认证,可在流行的Arm架构上用于云和本地部署。借助Ampere Altra系列处理器,Oracle数据库的用户拥有了一个高性能、高能效的架构,该架构在构建时考虑了可持续发展的需要,适合各种规模的组织。
- 自治数据库无服务器已获得金牌高可用性架构 (MAA) 层功能认证,这意味着用户可以使用自治数据库无服务器快速部署数据库,从而实现两分钟以内的RTO,并且数据丢失几乎为零。
- Oracle LiveLab推出新实验:Oracle 23c十大开发者特性,包括SQL Domain和Annotation等。
- OCI中专用Exadata基础设施和Exadata Cloud@Customer的自治数据库支持Database In-Memory(数据库内存列存储)。
- 支持使用Oracle Database Service for Azure设计多云灾难恢复解决方案。
- Oracle Graph支持SQL属性图(在23c开发者免费版中),SQL属性图允许使用SQL 2023标准中的新语法创建和查询图。它还包括通过PGQL提供的附加功能,以及使PGQL与SQL标准紧密结合的更新。
- Oracle推出集成矢量数据库来增强生成式AI并大幅提高开发人员的工作效率。
- 支持Select AI - 在自治数据库上从自然语言到SQL生成。
- Oracle GoldenGate发布23c Free版,支持将实时数据变化流式传输到GenAI(生成式AI)引擎使用的RAG向量嵌入中,以回答企业数据的问题。“GoldenGate for Big Data”更名为“GoldenGate for Distributed Applications and Analytics”,以此表明GoldenGate重新关注分布式应用程序和去中心化分析。
- Oracle通过新的开源数据管理解决方案扩展云服务,其中包括OCI Database with PostgreSQL,OCI Cache with Redis,OpenSearch增强,Data Flow with Apache Spark增强等。
- 多项中国客户在之前CAB中提出的功能已被实现,包括数据库自行管理数据生命周期、Exadata灵活配置、列式存储 、分片、分布式Times-Ten、基于PDB的数据卫士、区块链表和人工智能的支持等等。在新的版本中也宣布实现了使用Paxos的分布式数据库、对国产ARM架构CPU的支持,以及国密算法的支持等。
MySQL开启稳定版和创新版同时发行新阶段
2023年下半年,MySQL版本发行迎来了重要的变化,开启了稳定版和创新版同时发行的新阶段。8.0发布了两个版本,8.0.34和8.0.35,还发布了8.1和8.2的创新版。而OCI的MySQL HeatWave服务,这是一个可以同时处理事务处理、实时分析和机器学习负载的云服务,也发布了不少新特性。以下是对这些更新的简要介绍:
一、MySQL稳定版更新
1、新的密码验证系统变量:
- 引入新变量validate_password.changed_characters_percentage以配置用户更改密码时必须变更的最小字符数。
- 基于当前密码字符总数的百分比来确定必须更改的字符数。
2、复制变更:
- `binlog_format` 服务器系统变量已弃用,未来可能会被删除。MySQL未来将专注于支持基于行的二进制日志记录,逐渐淘汰其他日志记录格式。
- `binlog_transaction_dependency_tracking` 变量已弃用,未来版本可能删除。现在设置或检索此变量的值会触发警告。
3、`mysql_native_password` 身份验证插件弃用:
- 此插件在未来版本中将被移除。
- 现在使用此插件进行身份验证的账户会在服务器错误日志中收到弃用警告。
4、新增默认值功能:
- `CURRENT_USER()` 可以用作某些表定义语句中的默认值,如 `VARCHAR` 和 `TEXT` 类型列,支持函数 SESSION_USER() 、 USER() 和 SYSTEM_USER() 。
5、组复制重要变更:
- 放宽了组复制的版本要求,允许更灵活的服务器版本组合参与复制。
- 新变更允许服务器版本8.0.35或更高版本加入同一复制组。
6、通配符授权功能弃用:
- 该改变涉及到数据库层级的权限分配。数据库名称中的"%"和"_"作为通配符现在已经不推荐使用,未来版本可能会删除此功能。目的是让这两个符号始终被视为普通字符。另一个改变涉及主机名称"%"在权限检查时代表localhost的功能现在也不推荐使用,未来可能删除此自动匹配功能。到时候,需要明确使用localhost主机名授予权限。
7、INFORMATION_SCHEMA.PROCESSLIST弃用:
- 推荐使用 Performance_schema的替代,与旧的SHOW PROCESSLIST 实现不同,它不需要获取mutex并且具有更好的性能。
二、MySQL创新版更新
1、EXPLAIN FORMAT=JSON输出增强,增加了 `INTO` 选项,允许将输出保存在用户变量中。
2、加强了关闭服务器过程的日志:
- 加强了与服务器、插件和组件的启动和关闭相关的日志记录。
- 这将有助于故障排除,尤其是在服务器关闭过程缓慢的情况下。
3、增加组复制插件的状态变量:引入了特定于组复制的新状态变量,以改善网络不稳定情况下的诊断和故障排除。
4、MySQL Shell 8.2新版本提供了便利的实例、模式和表复制功能。与以往通过文件进行的导出、导入方法相比,无需中间存储,大大提高了便利性。
5、` expire_logs_days `系统变量删除:弃用并替换为`binlog_expire_logs_seconds`。
6、MySQL企业版防火墙更新:
- MySQL Enterprise Firewall:允许定期重新加载内存缓存中的防火墙数据表,提高了数据表管理的灵活性。此外,MySQL Enterprise Firewall以前将内部表、函数和存储过程存储在MySQL系统数据库中。现在,新的mysql_firewall_database服务器系统变量允许指定一个自定义数据库。
7、MySQL Router 8.2.0更新
读写分离功能:
- 新功能允许将读写流量分别定向到只读和读写实例。
- 提高了数据库操作的效率和可靠性。
MariaDB Server 10.11发布
MariaDB Server 10.11是一个长期稳定的版本,维持到2028年2月。
一、新特性 - OLTP产品线
1、【王炸功能】Alter修改表结构实现从库无延迟并行复制:通常,ALTER TABLE首先在主库上执行完毕后,才被复制并开始在从库上执行。有了这个特性,当ALTER TABLE在主库上开始执行时,它会立刻被复制并开始在从库上执行。这样可以完全消除从库的复制滞后,即可实现从库无延迟并行复制。
使用:
MariaDB> set global binlog_alter_two_phase=1;
MariaDB> set binlog_alter_two_phase=1;
MariaDB> alter table sbtest1 add index IX_pad(pad);
ALTER TABLE回车后,你可以立即用mysqlbinlog工具去查看binlog,可以看到ALTER TABLE语句已经记录在binlog文件里。
2、为SQL线程添加了global.slave_max_statement_time系统变量:以限制每次SQL thread线程长时间执行,当超过此值(以秒为单位)SQL thread线程执行的SQL将被中止。
3、MariaDB多源复制添加FOR CHANNEL关键字兼容了MySQL多源复制的语法。
4、基于GTID模式建立同步复制时,change master to语法弃用了MASTER_USE_GTID = Current_Pos选项,以支持新的MASTER_DEMOTE_TO_SLAVE选项。
5、支持在线动态调整innodb_log_file_size重置事务日志文件大小。
二、新特性 - OLAP产品线
MariaDB ColumnStore利用分布式列式存储和大规模并行处理(MPP)共享无架构扩展了MariaDB企业服务器,将其转变为独立或分布式数据仓库,用于复杂SQL查询和高级分析,而无需创建任何索引。
1、MariaDB Columnstore 10.6支持一键部署:为了简化安装过程,让用户享受更好的产品体验,MariaDB提供yum源方式部署,用户只需几条命令,即可轻松部署OLAP MPP数据仓库环境。
mysqld服务启动后,手工安装存储引擎插件即可完整部署。
MariaDB> INSTALL PLUGIN Columnstore SONAME 'ha_columnstore.so';
SQL语法使用起来跟InnoDB无任何差异。
参见官方文档:
https://mariadb.com/docs/columnstore/deploy/topologies/single-node/community-columnstore-cs10-6/#Install_ColumnStore_via_YUM_(RHEL,_CentOS)
2、MariaDB Columnstore引擎使用注意事项:【重大改变】支持与InnoDB同步复制
现在,可以使用 "CHANGE MASTER TO" 命令与业务库中的InnoDB引擎建立同步复制,而无需依赖于ETL工具。通过这种方式,可以实现增量数据的同步。
PostgreSQL发布16.1新版本/更新15、14、13、12、11版本
2023年下半年,PostgreSQL主要发布了11、12、13、14、15版本系列的修正版本11.22(最终版本,不再提供更新)、12.17、13.13、14.10、15.5及16.1正式版本,其中值得关注的新特性有:
1、性能:
- 改进了其内存和磁盘排序算法,基准测试显示,在对不同数据类型的排序时,速度可提高25%到400%不等 。使用row_number()、rank()、dense_rank() 和 count() 作为窗口函数在PostgreSQL中也有性能上的优化。
- 使用SELECT DISTINCT的查询现在可以并行执行。
2、开发:
- PostgreSQL包含SQL标准的MERGE命令。MERGE允许用户编写包含INSERT、UPDATE和DELETE操作的SQL语句。
- 最新版本增加了使用正则表达式的新函数来检查字符串:regexp_count(), regexp_instr(), regexp_like(),和 regexp_substr()。
- PostgreSQL 15还扩展了range_agg函数来聚合上一个版本引入的multirange数据类型。
3、安全特性:
- 可以方便地使用pg_read_all_data和pg_write_all_data预定义角色为用户分配表、视图和模式的只读和只写权限。
4、监控与管理:
- PostgreSQL将其性能提升扩展到了其vacuuming系统。本版本包括用于减少B树索引开销的优化。此版本还添加了一个vacuum的“紧急模式”,旨在防止事务ID环绕。ANALYZE用于收集数据库统计信息,基于其自身的性能改进,现在在PostgreSQL中运行速度明显更快。
- 现在可以配置PostgreSQL的TOAST系统的压缩选项,该系统用于存储较大的数据,如文本块 或几何图形。PostgreSQL为TOAST列添加了LZ4压缩,同时保留对pglz压缩的支持。
5、BUG修复和改进:
- 修复了GiST索引在“页面拆分”期间出现错误行为的问题可能导致后续索引搜索结果不正确的操作。
- 修复了B树索引错误地删除重复列的问题。
- 修复了将批量表插入分区表的问题。
- 修复了在步骤中具有多个分区键的哈希分区表在某些情况下可能导致崩溃的生成和运行时修剪。
- 修复了使用READ COMMITTED模式时MERGE期间并发更新行的不一致重新检查的问题。
- 将pg_dump修复为转储订阅的新选项。
- 修复pg_restore,以便选择性还原将同时包含表级和列级ACL对于选定的表。
OceanBase发布4.2.1 LTS版本
2023年,OceanBase企业版及社区版共计迭代27个版本,新增超过450项功能。11月16日,OceanBase发布一体化数据库的首个长期支持版本4.2.1 LTS。作为4.x的首个LTS版本,该版本的定位是支撑客户关键业务稳定长久运行,可在关键业务负载中放心地规模化使用。经过十余个版本的迭代打磨,新的一体化版本已经在生产环境支撑了上百个业务系统稳定运行。
1、兼容性:
OceanBase 4.2.1 LTS是面向OLTP核心场景的全功能里程碑版本。Oracle兼容性层面在复杂查询、存储过程、JSON、Database Link进一步提升,MySQL兼容模式在之前的版本已经对MySQL 5.7有很好兼容能力的基础上,4.2.1 LTS版本引入了大量MySQL 8.0的新功能兼容。
2、性能:
OLTP性能在各种规格下相比之前的版本均有较多提升。在96 Core机器上,sysbench压测的性能相比3.2.4版本提升9%到100%。新版本对于小规格有更大幅度的优化,提升比例从51%到152%不等,在read only、insert、update三种场景的性能都达到了3.2.4版本的2倍以上。OLTP分析查询场景性能有大幅度提升,新版本TPC-DS 100G性能是3.2.4版本的2.7倍,性能优化效果显著。
3、业务连续性:
新增仲裁无损容灾能力,提供创新的仲裁无损容灾,通过两副本实现RPO=0,帮助用户实现更具性价比的异地容灾。同时,面向更多场景的RTOTXT,支持用户输入自定义行分隔符。
2、功能改进
- 优化dmfldr并发执行数据加载功能。
- 优化Manager工具debug定位功能,同时支持在Debug工具中查看变量类型。
- DEM在实时监控中增加显示分配使用率,同时优化系统健康度判断功能。
- DTS工具命令行执行对比,优化生成的excel报告。
- 优化ODBC绑定的SQL类型SQL_VARCHAR相关功能。
- JDBC连接查询功能优化。
3、性能优化
- 数据库发起的绑定变量SQL生成执行计划时,优化范围查询估算性能,提升效率。
- 计划执行过程中,当WHIT VAR计划下包含CONSTV时,优化重加载数据性能。
- 优化视图与包互相嵌套,层层调用情况下的SQL查询语句。
- 优化使用堆表全局索引查找数据功能。
ByConity发布0.3.0版本
一、2023下半年重大更新总结
字节跳动开源数仓ByConity 0.3.0版本于12月18日正式发布,该版本提供倒排索引、基于共享存储的选主方式等多项新特性,对冷读性能进一步优化,对ELT能力进一步迭代,同时修复了若干已知问题,进一步提升系统的性能和稳定性。
1、倒排索引:
在ByConity使用过程中,很多业务对文本检索相关能力(如StringLike)提出了非常高的需求,希望社区能够优化相关查询性能,同时兼容ClickHouse在今年支持的倒排索引的能力。为满足业务诉求,保持生态兼容,同时提升ByConity的文本检索能力,ByConity在0.3.0版本加入了对文本检索的支持,为日志数据分析等场景提供高性能查询。
2、基于共享存储的选主方案:
在ByConity架构中存在多种控制节点,它们需要各自通过多副本+选主来提供高可用的服务能力,例如Resource Manager,TSO等。实际中的多个计算server,也需要选出一个单节点来执行特定的读写任务。之前ByConity使用了clickhouse-keeper组件来进行选主,该组件基于Raft实现,提供兼容zookeeper的选主接口。但在实际的使用中遇到了很多运维问题,例如需要部署3个以上节点才能提供容灾,增加运维负担;节点增删和服务发现流程复杂;容器重启后如果服务变换ip和服务端口,keeper组件难以快速恢复,等等。考虑ByConity作为一个新的云原生服务,并不需要兼容ClickHouse对zookeeper的访问,我们选择了基于存算分离的云原生架构实现一种新的选主方式来优化以上问题。
3、冷读性能的进一步提升:
在ByConity 0.2.0中,通过引入IOScheduler等方式提高了冷读查询的性能,尤其是在S3上的冷读性能。0.3.0版本通过引入ReadBuffer的Preload等优化,进一步提高了冷读性能。
4、ELT能力增强:
在0.3.0中,引入新的BSP模式,通过stage by stage的执行以及增强disk based shuffle,满足有限条件下的计算,提高吞吐。在ByConity中复杂查询对query plan的stage进行了切分并进行了stage by stage的调度,但在语义上仍然是all at once的调度。ELT在执行时需要对查询进行分阶段运行,需要进一步达到stage by stage执行的效果。
二、明年展望
后续版本将会对异步处理模式和调度器的实现做进一步的增强。
AntDB发布8.0超融合数据库
2023年下半年,亚信安慧AntDB数据库发布了8.0超融合数据库,其中值得关注的新变化有:
1、一切皆可SQL的超融合数据库:超融合架构从实验室环境正式走向生产,以六大执行引擎共存为基础,为上层的交易、分析、高频处理、实时计算、物联网连接、AI向量计算提供底层数据服务。用户可在包括标准SQL在内的ODBC、JDBC、Python以及各种开发框架下,使用AntDB数据库里的数据。
2、数据库内核里的流式计算:从内核层面引入流式计算“事件+推送”的消息模式,更注重实时性和并发处理能力。
3、集中式分布式一体化:一套代码同时支持集中式、分布式、云原生部署模式。
4、数据库迁移同步工具更新升级,实现面向新型多模态多引擎数据库的一键式评估、迁移、稽核与数据效验。
QianBase™发布QianBaseTP-15.0正式版及QianBaseMPP-7.0.0正式版
一、QianBaseTP
2023年下半年,QianBaseTP单机版主要发布了15.0的正式版本,在产品的功能性、兼容性和性能方面进行了提升,主要内容如下:
1、新增DATE,TIMESTAMP的格式化类型,增强decimal,numeric,number等数据类型,以及提升函数兼容性等。
2、新增connect by层次查询功能。
3、新增listagg列转行函数功能。
4、新增透明加密功能。
5、预写式日志无锁化,在TPCC场景下,Arm环境性能提升了约17%,x86环境性能提升了12%。
二、QianBaseMPP
2023年下半年,QianBaseMPP主要发布了7.0.0的正式版本,在产品的功能性、兼容性和性能方面进行了提升,主要内容如下:
1、新增同义词功能。
2、新增UPSERT功能。
3、进一步提升Oracle的兼容性,包含但不局限于binary_double,binary_float,to_nchar,sysdate,systimestamp等。
4、新增磁盘配额管理功能,可支持用户,模式,表级别的磁盘配额管理。
5、新增AO表唯一索引功能。
6、AO列存表,智能索引,支持block级别的Min,Max,BloomFilter过滤,在精准查询和小范围扫描的场景下,大幅提升查询性能。
ArkDB 2023下半年技术更新要点
- arkolap友好性改进,支持在线启动与在线修改数据源地址。
- 解决了arkdb在底层对象存储中,对象个数达到100万时启动速度变慢的问题。
- 修改arkolap在特定条件下,删除数据时报错的问题。
- 增强了arkdb启动时扫描对象的速度,增加了并行扫描的功能。
- arkolap同步逻辑中,sync cache manager存在性能问题,需要增加开关进行关闭。
- 修改ArkDB代码中,在特定情况下,一个函数被错误的调用导致堆栈错乱引起的崩溃问题。
- 修改执行计划的生成逻辑,提升了arkolap查询时的效率,实现多重条件下推的功能。
云数据库
PolarDB新增NL2SQL、列存索引多机并行、一站式HTAP、全加密等功能
2023年下半年,PolarDB发布了一系列新版本和功能,其中值得关注的版本、功能有:
一、PolarDB MySQL版
1、全方位降本,推出全新经济版,支持压缩功能、热温冷分层管理功能。
2、发布CRAC多写能力,推出基于共享存储的多机集群形态。
3、IMCI列存索引发布多节点全内存并行分析,在线事务处理和计算分析一体化。
4、发布DB4AI能力,一站式MLOps,内置NL2SQL、通义千问等大模型。
5、发布PolarDB+AnalyticDB、PolarDB+Tair DBCache一站式服务。
二、PolarDB PostgreSQL版
1、推出标准版,性价比相较企业版更具吸引力。
2、推出一站式HTAP服务,复杂查询性能最高可提升百倍。
3、发布全加密功能,支持对数据库表中的敏感数据列进行加密。
三、PolarDB分布式版
1、发布5.4.17和5.4.18两个大版本。
2、新增生成列的创建方法,以及在生成列上创建索引的方法。
3、新增支持affected rows行为。
腾讯云2023下半年数据库产品更新汇总
一、TDSQL MySQL版
- 公有云数据库审计能力正式发布。
- 公有云长期备份功能发布,最长可支持十年备份。
- 公有云支持用户按年/月/周保留周期性备份,优化备份管理。
- CDC版本多租户能力正式发布。
- 公有云接入DBbrain正式发布。
- 私有云DCN一拖二和强同步正式发布,已有核心系统投产使用。
- 私有化回收站功能正式发布,同时支持TXSQL5.7和8.0,针对误删库表场景可以秒级恢复。
- 私有化备份厂商适配取得进展,已有多家厂商完成适配,取得互认证证书。
- 私有化物理复制版本灰度上线,可试点使用。
- 私有化支持资源隔离,包括CPU、内存、磁盘可以做到严格限制。
二、TDSQL PostgreSQL版
- 发布融合版本,大幅提升HTAP能力;同一引擎支持行列混存,TP/AP性能大幅提升。
- 同一引擎支持PG/Oracle双语法生态。
- Oracle兼容性再上新台阶,对PL/SQL兼容度提升到90%以上,同时新增PL/SQL提前编译等功能。
- 新增支持单机和单表模式。
- 新增支持兼容PG15语法能力。
- 新增资源隔离能力,根据CPU/内存/并发度隔离业务。
- 资源熔断:CPU/内存/耗时/倾斜等超过阈值主动停止查询。
三、TDSQL-C推出Serverless 2.0版
云原生数据库TDSQL-C主要推出了Serverless 2.0版,发布了新内核特性以及全新功能,其中值得关注的动态如下:
- 推出Serverless 2.0版:支持一主多从混合集群版Serverless服务。
- TXSQL内核特性:支持自动kill空闲事务、动态线程池、闪回查询、计划缓存点查优化、热点更新保护等。
- 发布一键迁移2.0:支持将云数据库MySQL的实例全量迁移至TDSQL-C。
- 支持跨地域备份:提升数据跨地域容灾能力,加强数据库可用性及安全性。
- 支持CSI列存索引:通过使用列式数据格式存储等技术,实现更好的查询性能、更高的数据压缩率。
- 日志服务(CLS):支持慢日志数据投递,实现从日志采集、日志存储到日志检索等全方位的日志服务。
- 发布新版数据库审计:支持全审计和规则审计,支持事后告警。
- 可释放存储:全球首创可释放存储架构,实例暂停存储落冷,极致压缩存储成本。
四、DTS-DBBridge异构迁移能力升级
数据传输服务DTS-DBBridge异构迁移能力升级,支持Oracle、DB2等迁移能力,提升传输性能,增强稳定性、易用性,适配国产化信创环境。
1、新增10条链路:
- 新增Oracle到TDSQL MySQL正反向链路,同时支持一致性校验,SQL条件过滤。
- 新增Oracle到TDSQL PostgreSQL同步链路,同时支持一致性校验。
- 新增DB2到TDSQL MySQL同步链路,同时支持一致性校验。
- 新增MySQL/MariaDB/Percona到TDSQL MySQL正反向同步链路,同时支持一致性校验。
2、功能增强:
- TDSQL MySQL到TDSQL MySQL/Kafka链路中支持同步二级分区表。
- TDSQL MySQL到Oracle链路支持指定位点同步。
- 支持全量、增量阶段分离;批量任务管理;用户策略管理;软件License管理。
- 支持API接口功能。
- 支持跨可用区双AZ部署、单机部署。
3、适配国产化信创环境。
五、DBbrain持续提升数据库自运维能力
数据智能管家DBbrain值得关注的动态如下:
- 支持TDSQL MySQL版、MariaDB的实时智能诊断,提供7*24小时数据库异常发现、诊断分析、实时通知和优化建议等服务。
- 支持关系型数据库的SQL分析能力,提升问题洞察能力。
- Redis智能诊断能力增强:全面升级Redis大Key分析、热Key分析能力。支持事件通知。
- MongoDB智能诊断能力增强:深化MongoDB实时会话功能、支持会话统计分析。支持事件通知。
- 支持推送实时诊断告警信息到企业微信、飞书、钉钉群中。
- 私有化1.0.9.8版本发布,进一步深化实时诊断能力和全链路分析能力,提供完善和成熟的私有云解决方案。
六、腾讯云向量数据库(Tencent Cloud VectorDB)正式上线
Tencent Cloud VectorDB是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据,于2023年8月首次上线,主要特性包括:
- 自研向量检索引擎OLAMA:支持HNSW、IVF等常用向量索引,可支撑千亿级数据量和百万级QPS。
- 数据库能力:支持控制台管理并监控数据库实例,提供HTTP与SDK多语言接入并管理数据库。
- AI套件:提供一站式文档检索解决方案,包含自动化文档解析、信息补充、向量化、内容检索等。
- Embedding功能:自动将原始文本转换为向量数据并插入数据库或进行相似性检索,简化用户操作步骤,降低使用门槛。
- DMC:可视化管理数据库,支持在线执行数据插入、精确查询、相似度查询等操作,直观地查看执行结果。
- 外网访问:支持在控制台一键开启外网访问功能,按需配置访问白名单列表,方便用户测试或管理数据库。
- 多可用区部署:支持选择两可用区与三可用区,满足业务对高可用性与容错性的不同需求。
注:关于腾讯云云数据库MySQL、PostgreSQL、Redis、MongoDB、SQL Server、KeeWiDB、CTSDB、DTS、TDSQL TDStore等产品更新信息,可阅读本期Newsletter完整版(点击本文文末【阅读原文】可下载)
青云2023下半年数据库产品更新汇总
2023年7月5日,RadonDB DMP 1.3.0正式上线。该版本适用于KubeSphere Enterprise 3.4.1。
- OpenSearch增加jvm自适应。
- OpenSearch增加救援模式功能。
- OpenSearch支持通过配置对接第三方身份认证OIDC。
- Redis增加maxmemory参数自适应。
2023年10月25日,RadonDB DMP 1.4.0正式上线。该版本适用于KubeSphere Enterprise 3.5.0。
- OpenSearch中新增Logstash角色参数配置和独立监控告警功能。
- OpenSearch支持版本从2.3.0升级到OpenSearch 2.8.0。
- OpenSearch、Kafka、Redis支持预置集群告警。
2023年11月24日,RadonDB DMP 2.0.0正式上线。该版本适用于KubeSphere Enterprise 4.X订阅版。
- 支持多种类型数据库与中间件的的可视化创建与统一管理。
- 采用全新的微内核架构KubeSphere LuBan,支持RadonDB DMP功能扩展。
- 支持MySQL版本:5.7、8.0。
- 支持通过Uber日志格式改进命令和Sidecar中的日志记录。
- 支持OpenSearch、Dashboard、Logstash等节点的部署和管理。
- 支持Redis Cluster/Sentinel实例故障转移和自动恢复。
- Redis Cluster/Sentinel支持基于Prometheus Exporter的资源状态监控功能。
- 支持Kafka、RabbitMQ实例自动故障转移和恢复。
2023年9月7日,MySQL Plus 1.3.0正式上线。其中包含三个版本:基础版、高可用版、金融版。
- 支持采集MySQL慢日志输出到指定的Logstash。
- 适配更新MySQL内核版本至MySQL 5.7.41/8.0.31。
2023年9月27日,PostgreSQL PG V2.3.0正式上线。其中包含了两个版本:基础版、高可用版。
- 支持灾备集群的设置。
- 支持SSL加密传输。
- 支持pgvector插件。
2023年8月26日,Kafka 3.1.0 - v3.0.1正式上线。该版本基于Apache Kafka版本3.1.0构建。
- 新增支持使用SASL协议。
2023年9月24日,HBase 2.4.4 - v3.0.0正式上线。该版本基于Apache HBase 2.4.4、Apache Hadoop 3.2.1、Apache Phoenix 5.1.2构建。
- 新增重启服务和HDFS Balancer功能。
2023年12月25日,ClickHouse 1.2.0正式上线。该版本基于ClickHouse 22.3.20构建,其中包含了两个版本:基础版、企业版。
- 升级内核至22.3.20(修复22.3.6内存泄漏问题)。
- 增加多可用区部署功能。
拓数派发布大模型数据计算系统πDataCS,更新PieCloudDB多个版本
一、πDataCS
2023年10月24日,拓数派发布大模型数据计算系统(简称πDataCS),以云原⽣技术重构数据存储和计算,做到「⼀份数据,多引擎数据计算」。πDataCS主要解决海量数据的存储和实时计算问题,具备湖仓⼀体化的能力,用户可根据实际情况选择合适的数据计算引擎:云原生虚拟数仓PieCloudDB、向量计算引擎PieCloudVecotor和 (大模型)机器学习PieCloudML。目前,πDataCS面向国内市场提供公有云版、社区版、企业版及一体机多个版本。
二、PieCloudDB
云原生虚拟数仓PieCloudDB在2023年下半年,不管是内核还是云原生平台都进行了多个版本的更新:
1、内核模块更新:
PieCloudDB的内核版本从2.5.0升级至2.10版本。在近半年的版本更新中,PieCloudDB在功能、性能、稳定性、安全性上都有了大幅提升,新增众多重要更新:
- 压缩效率大幅提升:支持ZSTD、Dict Encoding、Delta Encoding等编码方法,对HLL支持游程编码,节省存储空间。
- 支持全新的全局缓存系统。
- 新增全新的元数据缓存服务。
- 自研全新的向量化执行器发布Alpha版本,带来性能的数量级提升。
- 云原生存储系统「简墨」Data Skipping功能进一步提升,新增预计算能力。
- 数据同步方面支持CDC(change data capture)功能。
2、云原生平台:
PieCloudDB云原生平台不断迭代,截至12月中旬共完成10个版本的更新,其中包括但不限于:
- 控制台功能上线:组织、数仓、用户、费用、权限等管理功能的集成。
- 支持LDAP或LDAPs协议。
- 控制台界面及用户交互方面大量更新。
- 权限管理优化。
- 虚拟数仓日志功能开放。
- 新增用量统计功能:可展示存储量、计算资源使用量和流量的统计数据。
- 外部连接工具PieProxy的优化与升级:支持Transaction和Session模式,支持白名单配置等功能。
SelectDB Cloud 3.0发布,增加全新产品形态
2023年9月25日,飞轮科技全面开放SelectDB Cloud云原生数据仓库,增加全新的私有仓库(BYOC)产品形态,同时发布了更自主可控的SelectDB Enterprise企业版。
1、云原生内核更新:
目前SelectDB最新内核版本为3.0.4。近半年来,SelectDB内核发布了3个两位版本共20个三位版本,从性能到稳定性都有大幅提升,新增众多重要更新:
- 更智能的全新查询优化器。
- 倒排索引。
- 自适应的并行执行模型。
- 跨集群数据同步CCR。
- 湖仓一体支持数十种数据源、几乎所有的开放湖仓格式和Metastore。
- 支持半结构化数据。
- 高性能文本分析算法。
- 自动统计信息收集。
- 内置JDBC Driver。
- 支持Stream Load。
2、云原生管控平台更新:
近半年来,SelectDB Cloud云原生管控平台持续迭代,新增重要更新如下:
- 私有仓库(BYOC)产品形态。
- 支持新建集群时自定义缓存空间。
- 支持新建组织和修改组织。
- 支持新客户自助注册组织(登录即注册)。
- 支持集群自动启停。