2023年10月15日消息,PlanetScale 最近宣布打算分叉 MySQL,添加向量搜索。虽然 PostgreSQL 一直是向量搜索的默认开源选择,但Vitess数据库背后的公司希望发布支持向量的 MySQL 和 PlanetScale 版本。
PlanetScale将实现分层可导航小世界(HNSW)算法,该算法可以构建优化的图结构并使在大型数据集中搜索向量相似性变得高效。PlanetScale 首席技术官Nick Van Wiggeren写道:
希望利用 MySQL 的强大功能、稳定性、可靠性和可扩展性的 AI/ML 应用程序。您将能够在 PlanetScale 中进行相同的存储和检索,从而显着降低成本和运营负担,而不是仅针对向量采用第二个数据库。
由于pgvector扩展,PostgreSQL 成为需要向量相似性搜索的项目中最流行的开源数据库。虽然 Oracle 最近宣布了对MySQL HeatWave 的增强,包括对向量存储的支持,但 MySQL 社区版尚不支持它。Percona 创始人兼开源倡导者 Peter Zaitsev评论道:
Oracle 对 MySQL 专有云的关注创新已越来越受到社区的关注。很高兴看到 PlanetScale 主动在 MySQL 中引入 Vector 支持。
向量支持对于嵌入至关重要,嵌入是一种使用机器学习将任意数据转换为向量并创建可进行相似性分析的统一数值表示的技术。该功能针对语义搜索、推荐系统、异常检测和图像识别工作负载等用例。AWS 生成式 AI 架构师John Hwang评论道:
向量数据库不是一个单独的数据库类别。事实上,每个数据库迟早都会提供向量搜索。在不久的将来,(…)向量数据库与非向量数据库之间的界限将变得模糊。
PlanetScale 并不是过去几个月中唯一引入向量支持的数据库:Cloudflare 宣布了Vectorize 的测试版,Timescale Vector通过更快的搜索增强了_pgvector_,Google Cloud 在托管数据库中集成了向量搜索。此外,Amazon OpenSearch Serverless 的向量引擎现已推出预览版,并且 Aurora PostgreSQL 支持_pgvector (_ InfoQ 上单独报道) 。MongoDB Atlas向量搜索最近推出,Oracle上个月宣布计划在Oracle Database 23c中支持AI向量相似性搜索。AnalyticDB for MySQL是阿里云上的托管数据库,提供向量搜索功能。
分叉 MySQL 的意图已经得到了积极的反应。范维格伦补充道:
PlanetScale 已经维护了 MySQL 的一个分支,我们将向其中添加向量类型和索引。发布后,我们将像今天一样在 PlanetScale 中运行该 MySQL 分支。我们将为 PlanetScale 风格的 MySQL 发布软件包和容器,允许用户在本地进行测试和开发。
该功能目前处于内测阶段,开发人员可以注册以获得即将发布的版本(https://planetscale.com/ai)的通知。
文章来源:https://www.infoq.com/news/2023/10/planetscale-fork-mysql/