GreptimeDB Roadmap 2024

2024年 3月 2日 33.3k 0

自 GreptimeDB 于 2022 年 11 月 15 日正式开源以来,我们持续致力于打造一个云规模、快速、高效的时序数据处理平台。感谢我们团队和社区的共同努力,GreptimeDB 已取得了许多成果。

当我们全力以赴迈入 2024 时,我们不禁思考:“下一代时序数据库究竟是什么样的?”

迈入 2024 年,我们将拥抱更多创新,GreptimeDB 也将迎来许多关键性的更新,这些关键更新将标志着我们产品能正式被纳入生产环境中使用,为用户呈现与行业内顶尖时序数据库相当的性能基准。

这篇 Roadmap 揭示了我们团队** 2024 正在努力实现的目标和暂定的版本发布计划**,为希望在 GitHub 上为 GreptimeDB 贡献代码的人提供一些切入点。

🌟 Roadmap issue on GitHub: https://github.com/GreptimeTeam/greptimedb/issues/3412

2024 年主要功能更新

2024 年,GreptimeDB 将会计划上线一系列重大升级更新,将极大提升 GreptimeDB 的功能和性能,优化用户体验。

下面是一些即将到来的亮点:

  • Metrics Engine (RFC[1])
    • Tracking Issue (db#2070[2])

一种针对可观测场景的全新引擎,它的主要目标是能处理大量的小表,特别适合云原生监控,比如使用 Prometheus 的场景。通过利用合成的宽表,这个新的 Engine 提供指标数据存储和元数据复用的能力,“表”在它之上变得更轻量,可以克服现有 Mito 引擎的表过于重量级的一些限制。

  • Greptime Flow (RFC[3])

    • Tracking Issue (db#3187[4])
    • 一个轻量级的可以对 GreptimeDB 数据流进行 Continuous Aggregation 的流计算组件。它可以被嵌入到 GreptimeDB 的 Frontend 中,也可以作为单独的服务独立部署在 GreptimeDB 的集群中。
    • 一个 Flow Job 可以被以 SQL 的形式被提交:
    	CREATE TASK avg_over_5m WINDOW_SIZE = "5m" AS SELECT avg(value) FROM table WHERE time > now() - 5m GROUP BY time(1m);
    
  • Index

    • Inverted Index (RFC[5])

      • Tracking Issue (db#2705[6])
    • Smart Index

      • 比如自动自动监控工作负载和查询性能,并在需要时自动创建相应的索引或者删除某些不被使用的索引。
    • Spatial Index

      • 支持地理位置信息存储及检索
  • GreptimeDB Distributed & Autopilot

    • Region Migration
      • 提供在 Datanode 之间迁移 region 的能力,实现热点数据迁移,以及负载平衡的水平扩展。
    • Auto Rebalance Regions
      • 基于 Region Migration 实现的自动化负载平衡调度。
  • Logs Engine

    • 针对日志数据的特性实现的存储引擎,并共用大部分 GreptimeDB 的架构和能力,例如 SQL 查询层、数据分片、分布式路由,以及查询、索引和压缩等都可以共享。使得 GreptimeDB 最终能够成为基于多引擎架构同时提供对 Metrics 和 Logs 数据最极致优化的存储层和相同访问体验的单一系统。

GreptimeDB 版本发布计划

下图展示了 GreptimeDB 2024 年的重大版本迭代路线(计划将根据实际发展略微调整):

🌟 一键跟踪 GreptimeDB 版本升级的最新进程: https://github.com/GreptimeTeam/greptimedb/milestones

GreptimeDB v1.0 将标志着我们向生产就绪版本迈出重要一步,搭载智能索引等进阶功能,重新定义效率与性能的新高标。

我们诚挚地邀请您持续关注 GreptimeDB,亲自体验 GreptimeDB v1.0 的卓越性能,赋能时序数据管理和分析,挖掘数据背后更大的价值。

  • v0.7(3 月)

    • Region Migration
    • Inverted Index
    • Metrics Engine
  • v0.8(4 月)

    • GreptimeFlow
  • v0.9(6 月)

    • Auto Rebalance Regions
  • v1.0(8 月)

    • Smart Index
    • Spatial Index
  • v1.1(10 月)

    • Logs Engine
  • v1.2(12 月)

    • Logs Engine
    • Data ingestion from popular log collectors

加入 Greptime 社区

如果对上文提及的任何功能感兴趣,欢迎在 GitHub 上 Star GreptimeDB,也欢迎前往 issue 页面,寻找一些有趣的 Good First Issues 进行实践。

我们不仅欢迎同学们积极参与上述计划中的功能开发,也期待任何意义上的创新想法~扫码添加微信小助手(文末二维码)加入技术交流群,或在 Slack 上加入 GreptimeDB 社区,和我们随时沟通你的反馈和想法。

Reference:

[1] https://github.com/GreptimeTeam/greptimedb/blob/main/docs/rfcs/2023-07-10-metric-engine.md

[2] https://github.com/GreptimeTeam/greptimedb/issues/2070

[3] https://github.com/GreptimeTeam/greptimedb/blob/main/docs/rfcs/2024-01-17-dataflow-framework.md

[4] https://github.com/GreptimeTeam/greptimedb/issues/3187

[5] https://github.com/GreptimeTeam/greptimedb/blob/main/docs/rfcs/2023-11-03-inverted-index.md

[6] https://github.com/GreptimeTeam/greptimedb/issues/2705

GreptimeDB 作为开源项目,欢迎对时序数据库、Rust 语言等内容感兴趣的同学们参与贡献和讨论。第一次参与项目的同学推荐先从带有 good first issue 标签的 issue 入手,期待在开源社群里遇见你!

Star us on GitHub Now: https://github.com/GreptimeTeam/greptimedb

微信搜索 GreptimeDB,关注公众号不错过更多技术干货和福利~

关于 Greptime:

Greptime 格睿科技致力于为智能汽车、物联网及可观测等产生大量时序数据的领域提供实时、高效的数据存储和分析服务,帮助客户挖掘数据的深层价值。目前主要有以下三款产品:

  • GreptimeDB 是一款用 Rust 语言编写的时序数据库,具有分布式、开源、云原生和兼容性强等特点,帮助企业实时读写、处理和分析时序数据的同时降低长期存储成本。

  • GreptimeCloud 可以为用户提供全托管的 DBaaS 服务,能够与可观测性、物联网等领域高度结合。

  • GreptimeAI 是为 LLM 应用量身定制的可观测性解决方案。

  • 车云一体解决方案是一款深入车企实际业务场景的时序数据库解决方案,解决了企业车辆数据呈几何倍数增长后的实际业务痛点。

GreptimeCloud 和 GreptimeAI 已正式公测,欢迎关注公众号或官网了解最新动态!对企业版 GreptimDB 感兴趣也欢迎联系小助手(微信搜索 greptime 添加小助手)。

官网:https://greptime.cn/

GitHub: https://github.com/GreptimeTeam/greptimedb

文档:https://docs.greptime.cn/

Twitter: https://twitter.com/Greptime

Slack: https://www.greptime.com/slack

LinkedIn: https://www.linkedin.com/company/greptime

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论