5 月 13 日-17 日,国际数据库顶级学术会议 ICDE 2024 在荷兰乌得勒支举行,OceanBase 联合高校共同研究的三篇论文成功入选。
ICDE 与 SIGMOD、VLDB 并称数据管理与数据库领域的三大国际顶级学术会议,入选为中国计算机学会(CCF)推荐的 A 类国际学术会议,在国际上享有盛誉并具有广泛的学术影响力。本次 ICDE 2024 论文入选,标志着继 ICDE 2023 的死锁检测论文之后,OceanBase 在数据库领域科研创新的进一步突破。
OceanBase CTO 杨传辉在 ICDE 2024 进行了 《OceanBase: From OLTP to HTAP》报告分享,讲述了自 2010 年成立以来 OceanBase 从分布式 OLTP 向 HTAP 实时分析演进过程中所遇到的技术挑战,以及分布式 SQL 数据库行式存储、列式存储、资源隔离、复杂查询以及多模等方面的最新进展。
入选论文概述
入选论文 1
《Functionality-Aware Database Tuning via Multi-Task Learning 》
此论文的研究工作由 OceanBase 与华东师范大学数据科学与工程学院科研团队共同完成。为了有效解决 OceanBase 等数据库 DBA 在参数调优方面遇到的问题,论文设计了一个功能感知的数据库调优系统,简称 OBTune,并展示了其在 OceanBase 中的应用。该论文也是首篇在整体性能和各种数据库协同优化的研究论文,研究的主要发现包括:
○ 论文演示了基于黑盒的自动调整方法在调整与整体数据库性能变化无关的knobs时可能带来的问题,指出了在线数据库实例应用不合理参数的潜在风险。
○ 提出了基于多任务学习的自动调整框架,允许 DBA 在调整整体性能的同时调整特定的数据库功能。功能的 knobs 自动调节被视为辅助学习任务,主要任务是调节整体性能。
○ 实现了功能感知自动调优方法(即OBTune),并在分布式数据库系统OceanBase 和集中式数据库系统 PostgreSQL 上对其进行了评估。实验结果表明 OBTune 可以为单机数据库和分布式数据库(单机分布式一体化数据库)有效、准确地调节触发功能组件的 knobs。
ICDE 审稿人高度评价该论文,认为其提出了一种先进的创新性数据库调优框架,并通过详细的设计和实现向业界展示了该方法的优势和潜力,该框架的提出推进了现有技术的发展。
入选论文2
《Generative and Contrastive Paradigms Are Complementary for Graph Self-Supervised Learning》
该研究论文由 OceanBase 与武汉大学共同完成,提出了 GCMAE 框架,将生成式和对比式学习范式相结合,提升了图自监督学习的性能。传统方法如 MAE 和 CL 各自独立使用,但我们观察到它们互补。因此,GCMAE 集成了 MAE 和 CL 分支,共享一个编码器,使得 GCMAE 能够充分利用全局信息。我们在四个流行的图任务上评估了 GCMAE,并与 14 个最先进的基线方法进行了比较。结果显示,GCMAE 在各任务上均提供了良好的准确性,最大准确性提高率相对于最佳基线方法高达 3.2%。
入选论文3
《BENCHTEMP: A General Benchmark for Evaluating Temporal Graph Neural Networks》
该论文由 OceanBase 与武汉大学共同完成,提出了 BENCHTEMP,这是一个用于评估各种任务下 TGNN 模型的通用基准。提供了一系列基准数据集和统一的评估流程,助力研究人员更加高效地评估和开发时序图神经网络模型。BENCHTEMP 支持多种任务和设定,并同时考察了模型的有效性和效率,为 TGNN 模型的公平比较和全面评估奠定了基础。
写在最后
截至目前,OceanBase 已在 SIGMOD、ICDE、VLDB 等权威学术期刊发表了 20 余篇论文,其中有 11 篇为 CCF A 类论文。这代表着 OceanBase 在数据库领域的技术能力和创新成果得到了全球数据库领域学术界的认可,同时也为数据库技术的进步和发展做出了积极贡献。
自 2010 年成立以来,OceanBase 高度重视科研合作与人才培养,与华东师范大学、武汉大学、中国人民大学、南京大学、同济大学、华中科技大学、山东大学等众多高校展开深入研究合作,涵盖联合实验室、科研课题、数据库课程改革及数据库大赛等领域。同时,OceanBase 与蚂蚁技术研究院、CCF 共同推出科研基金,致力于在“单机分布式一体化”、“TP & AP 融合”、“存算分离”、“性能优化”等方向展开深入研究,推动研究成果向实际应用转化。