Oracle AI Vector Search 是一项新颖的功能,除了数据库传统上支持的属性值或关键字等数据值之外,它还允许用户根据数据的语义或含义来搜索数据。
向量或向量嵌入是人工智能应用中使用的一种流行的数据结构。向量是由深度学习模型根据不同数据类型(例如图像、文档、视频等)生成的数字列表,对数据的语义进行编码。
Oracle AI Vector Search 允许您利用 SQL 的全部功能来生成、存储、索引和查询向量嵌入以及其他业务数据。例如,对于搜索文档,向量搜索通常被认为比基于关键字的搜索更有效,因为向量搜索基于单词背后的含义和上下文,而不是实际单词本身。
Oracle AI Vector Search 允许您将语义文档搜索与结构化文档属性搜索结合起来。例如,在技术文章数据库中,诸如“查找某个作者在过去 5 年内发表的有关针对企业用例微调大型语言模型 (LLMs) 的文章”的问题以及某个国家/地区的某个出版商”,需要搜索可能存在于一个或多个表中的文章文本和文章属性。
Oracle AI Vector Search 包含一系列强大的功能,可支持业务用例的语义搜索。这些功能包括
- 新的 SQL 运算符可从非结构化数据生成向量嵌入
- 用于存储向量嵌入的新的一流 VECTOR 数据类型
- 新的最先进的向量索引用于快速近似搜索
- 新的 SQL 运算符和语法,可轻松表达业务查询中的相似性搜索
- 支持完整的生成式 AI 管道,包括预处理和向量化数据,以及使用业务数据增强 LLMs
VECTOR 数据类型完全集成在 SQL 和 PL/SQL 中,并支持多种客户端和编程语言,并在 python-oracledb、node-oracledb、JDBC 和 ODP.NET 驱动程序中具有本机绑定功能。这种全面的支持提供了跨多个开发环境的无缝向量搜索功能。
Oracle AI Vector Search 还完全集成到流行的第 3 方生成式 AI 框架(例如 LangChain)中。
Oracle AI Vector Search 包括本机 API,可对 LLM API 进行 REST 调用,以进行内容生成(如文本)或摘要以及生成 AI 管道中使用的其他操作。这些新功能可无缝支持检索增强生成 (RAG),这是一种突破性的生成式 AI 技术,可利用私有业务数据增强大型语言模型 (LLMs),从而对业务数据的自然语言问题提供准确的响应。
Oracle AI 向量搜索的优势
Oracle 数据库是领先的运营和企业数据存储库。企业应用程序通常需要搜索业务数据和非结构化数据的组合。例如,零售网站可以基于自然语言产品描述和目标产品图像以及其他过滤器(例如价格、商店位置、制造商和当前可用性)进行搜索。这种搜索需要同时搜索非结构化目录数据(产品描述和图像)、结构化目录数据(价格、商店位置和制造商)以及实时交易数据(例如当前库存)。
Oracle 数据库和 Oracle AI Vector Search 的融合功能相结合,提供了多种独特的优势。
AI向量数据与您的业务数据的无缝结合
这是 Oracle AI 向量搜索的一个关键优势,因为它允许用户在现有的 Oracle 数据库中运行 AI 支持的向量相似性搜索,而不必将业务数据移动到单独的向量数据库。避免数据移动可以降低复杂性、提高安全性并支持对当前数据的搜索。
Oracle AI 向量搜索通过使用简单、直观的 SQL 和融合数据库的全部功能(JSON、图形、文本、关系、空间等)将复杂的业务数据搜索与 AI 向量相似性搜索相结合,实现比大多数专用向量数据库更强大的搜索. 所有这些都在一个查询中。
利用业务数据支持检索增强生成
向量数据库改进了与 LLMs 的交互,因为它们为 LLMs 提供特定于场景的私有上下文以获得更准确的答案。这是一个众所周知的工作流程,称为检索增强生成 (RAG)。
Oracle AI Vector Search 还充分利用业务数据的全部功能,进一步细化LLM 交互,利用安全过滤器、业务指标和业务规则等业务标准,从而为企业提供超复杂的 RAG。
支持业务数据的完整生成人工智能管道
Oracle AI Vector Search 支持本机数据库 API,以从头到尾执行生成式 AI 管道的所有方面,使您的开发人员能够更轻松地直接在 Oracle 数据库中使用业务数据构建下一代 AI 应用程序。
AI 向量搜索和完整机器学习套件的独特组合
Oracle 数据库提供全套数据库内机器学习算法以及 AI 向量的相似性搜索。这种组合使 Oracle 数据库能够处理非常广泛的 AI 使用案例,涉及机器学习操作(决策、预测、分类、预测等)以及基于 AI 的向量搜索的功能。例如,可以轻松地将推理和分类与 AI 向量搜索结合在同一个 SQL 查询中。
经过验证的企业级可扩展性、容错性和安全性
Oracle数据库是领先的业务数据存储库,业务数据和语义搜索的结合是企业实施人工智能解决方案所需要的。 AI 向量搜索内置于 Oracle 数据库中并利用:
-
分区、RAC、分片和 Exadata 可实现经过验证的工业级可扩展性。
-
极端的 HA 和 DR 技术,例如 Data Guard、Golden Gate、Flashback、RMAN、ZDLRA 等。
-
Oracle Advanced Security 提供尖端安全性,包括透明数据加密、Key Vault、Audit Vault、虚拟专用数据库等功能。
示例用例
Oracle AI Vector Search 可将语义和业务数据搜索相结合,从而快速、安全地提供更准确的答案。通过在 Oracle 数据库中添加 AI 向量搜索,用户可以快速、轻松地获得人工智能的优势,而无需牺牲安全性、数据完整性或性能。
用例包括:
- 对话式人工智能或聊天机器人:构建人工智能驱动的数字助理
- 相似性搜索:将客户与产品匹配
- 基于内容的过滤:启用个性化推荐,从图片中定位零售商品
- 自然语言处理:文本分类和聚类 SQL 生成
- 数据分析:异常检测、模式识别
- 计算机视觉:人脸识别、生物特征识别、物体检测
- 生物医学研究:基因/DNA相似性研究、分子结构搜索
- 地理信息系统:空间分析、地图渲染
- 工业应用:质量控制、预测性维护、机械故障
概括
Oracle AI Vector Search 与 Oracle 数据库相结合,支持新型应用程序,通过利用现有业务数据增强的 LLMs 进行语义搜索,从而可以改变传统业务流程。
- 新的 SQL 运算符和语法使您能够轻松地将业务数据的关系搜索与非结构化数据的语义搜索结合起来
- 使用 Oracle 数据库进行人工智能驱动的向量相似性搜索 – 无需将业务数据移动到单独的向量数据库
- 轻松利用检索增强生成 (RAG) 通过企业特定内容来增强 LLM 响应
- 利用 Oracle 数据库的企业级安全性、可扩展性和分区功能增强您的应用程序