TiDB Serverless 支持向量检索

2024年 2月 5日 48.2k 0

原文链接:https://www.pingcap.com/blog/integrating-vector-search-into-tidb-for-ai-applications/

我们很高兴地宣布,我们的全托管数据库即服务(Database-as-a-Service)TiDB Serverless(https://tidb.cloud/) 产品正在为 MySQL 领域引入内置的向量搜索。有了这项支持,您将能够在不需要新的数据库或额外的技术栈的情况下,使用 TiDB Serverless 开发您的 AI 应用。现在就加入我们的私有测试名单,访问 tidb.cloud/ai。

理解向量搜索

与传统基于关键词的搜索不同,向量搜索基于理解数据的意义和上下文。它将复杂的数据——如文本、图像或音频——转换为数值向量(embeddings)。这些 embeddings 使得数据库能够基于语义理解而非仅仅是精确的单词匹配来进行搜索。这种方法对于处理大量非结构化数据的AI应用至关重要,其中精确度和上下文是关键。

向量搜索不仅仅是关于更智能的数据解释;它还关乎性能和可扩展性。TiDB Serverless 优化了查询效率,使得在大型复杂数据集上进行更快、更准确的搜索。通过在 TiDB Serverless 中添加向量搜索,我们正在增强其处理 AI 和机器学习工作负载的能力。这使得它成为 MySQL+AI 生态系统中开发者的强大工具。

为什么我们需要在 MySQL 中使用向量搜索?

随着 AI 继续重塑行业,对能够处理复杂、高维数据的数据库的需求激增。尽管传统 的MySQL 数据库强大且流行,但在处理 AI 应用时遇到限制:

  • 传统的 MySQL 系统通常不处理 AI 应用中普遍存在的非结构化数据,如文本、图像和音频。这导致了数据处理和查询中的低效和瓶颈。
  • MySQL 的架构缺乏对深度语义理解的原生能力,这对于准确解释和利用 AI 生成的数据至关重要。

通过将向量搜索能力添加到 MySQL 系统中,开发者可以与管理结构化数据一起管理向量嵌入。这极大地简化了 AI 中关键的多样化数据处理。进行语义丰富的搜索的能力增强了 MySQL 的功能,使其超越了基本的关键词匹配。

TiDB Serverless 内置向量搜索的好处

2023 年见证了 AI 应用领域的一个关键转变,对可扩展、灵活且成本效益高的解决方案的需求日益增长,以管理高维数据。虽然出现了专门的向量数据库,但人们越来越意识到,向量搜索应该是现有数据库的一个集成特性,而不是一个独立的实体。

通过内置向量搜索,TiDB Serverless 正在引领这一变革,将传统数据库功能与向量搜索的先进能力相结合,为 MySQL 生态系统提供了两者的优势。关键好处包括:

  • 可扩展以满足AI需求:TiDB Serverless 为 AI 应用的动态和不可预测的数据需求提供弹性可扩展性。这保证了效率和经济运营。其混合事务/分析处理(HTAP)和 Serverless 架构支持实时、广泛的数据处理,这对于大型语言模型和AI应用至关重要。
  • MySQL 和向量搜索合二为一:内置方法消除了向量和操作数据的单独数据库的需求,从而避免了数据冗余。直接在 MySQL 数据旁边存储向量嵌入,简化了数据架构,同时保持了 SQL 的简洁性。
  • 轻松加入向量数据:开发者可以利用熟悉的 SQL 环境轻松地连接、索引和查询操作和向量数据。这种能力使得高级语义搜索成为可能,结合了向量搜索的力量和 MySQL 的可靠性与便捷性。
  • 广泛的用例:带有向量搜索的 TiDB Serverless 支持从检索增强生成(RAG)到语义搜索的广泛应用。该系统与 OpenAI、Hugging Face、LangChain 和 LlamaIndex 等领先的 AI 平台和工具无缝集成,拓宽了其在各种 AI 驱动场景中的应用。

我们是如何实现这一目标的?

TiDB Serverless 的健壮架构,专为水平扩展和分布式计算设计,已经为处理 AI 应用的工作负载做好了准备。通过创新地将向量数据类型引入我们独特的存储引擎,并实现类似分层导航小世界(HNSW)的相似性搜索索引和算法,我们已经能够在 TiDB Serverless 中高效地存储、索引和检索向量数据。这一架构进步优化了表扫描和计算,允许通过 SQL 直接将向量数据与传统数据类型连接起来。

结果呢?可以轻松实现在您的 MySQL 工作流程中无缝集成 AI。您可以通过您喜欢的 MySQL 工具存储和检索向量数据,并在不离开舒适区的情况下利用强大的 AI 能力。

共同塑造AI应用的未来

与 TiDB Serverless 和向量搜索的旅程不仅仅是推动技术极限。这是关于重新定义数据如何推动 AI 创新。我们不仅仅是在构建一个产品,而是在您的熟悉 MySQL 环境与 AI 时代的无限可能性之间打造一座无缝的桥梁。准备好与我们一起开创未来了吗?加入我们的私有测试名单,访问 https://tidb.cloud/ai。您还将收到最新的更新,并成为首批体验带有向量搜索的 TiDB 的强大功能的人。

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论