客户可以构建生成式 AI 应用程序,而无需 AI 专业知识、数据移动或额外成本
HeatWave GenAI 的矢量处理速度比 Snowflake 快 30 倍,比 Google BigQuery 快 18 倍,比 Databricks 快 15 倍
德克萨斯州奥斯汀2024年6月26日电 /美通社/ -- 甲骨文公司今天宣布全面推出HeatWave GenAI,其中包括业界首款数据库内大型语言模型()、LLMs自动化数据库内向量存储、横向扩展向量处理,以及以非结构化内容为依据的自然语言进行上下文对话的能力。这些新功能使客户能够将生成式 AI 的强大功能引入其企业数据,而无需 AI 专业知识,也无需将数据移动到单独的矢量数据库。HeatWave GenAI 可立即在所有 Oracle 云区域、Oracle 云基础设施 (OCI) 专用区域以及跨云使用,HeatWave 客户无需支付额外费用。
借助 HeatWave GenAI,开发人员可以使用内置嵌入模型,通过单个 SQL 命令为企业非结构化内容创建矢量存储。用户可以使用数据库内或外部 LLMs在单个步骤中执行自然语言搜索。数据不会离开数据库,并且由于 HeatWave 的极端规模和性能,无需配置 GPU。因此,开发人员可以降低应用程序复杂性、提高性能、提高数据安全性并降低成本。
甲骨文首席企业架构师 Edward Screven 表示:“随着 HeatWave GenAI 添加到现有的内置 HeatWave 功能中,HeatWave 的惊人创新步伐仍在继续:HeatWave Lakehouse、HeatWave Autopilot、HeatWave AutoML 和 HeatWave MySQL。如今,集成和自动化的 AI 增强功能使开发人员能够更快地构建丰富的生成式 AI 应用程序,而无需 AI 专业知识或移动数据。用户现在可以通过一种直观的方式与企业数据进行交互,并快速获得业务所需的准确答案。
“HeatWave GenAI 使利用生成式 AI 变得非常容易,”SmarterD 首席执行官 Vijay Sundhar 说。“对数据库LLMs内和数据库内向量创建的支持大大降低了应用程序的复杂性,可预测的推理延迟,最重要的是,我们无需使用LLMs或创建嵌入的额外成本。这确实是生成式人工智能的民主化,我们相信它将通过HeatWave GenAI构建更丰富的应用程序,并显著提高我们客户的生产力。
新的自动化和内置生成式 AI 功能包括:
-
数据库LLMs内以更低的成本简化了生成式 AI 应用程序的开发。客户可以从生成式 AI 中受益,而无需复杂的外部LLM选择和集成,也无需担心各种云提供商数据中心的LLMs可用性。数据库LLMs内使客户能够使用 HeatWave Vector Store 搜索数据、生成或汇总内容以及执行检索增强生成 (RAG)。此外,他们可以将生成式 AI 与其他内置的 HeatWave 功能(如 AutoML)相结合,以构建更丰富的应用程序。HeatWave GenAI 还与来自领先LLM提供商的预训练基础模型集成。
-
自动化数据库内 Vector Store 使客户能够将生成式 AI 用于其业务文档,而无需将数据移动到单独的 Vector 数据库,也无需 AI 专业知识。创建矢量存储和矢量嵌入的所有步骤都是自动化的,并在数据库内执行,包括发现对象存储中的文档、解析它们、以高度并行和优化的方式生成嵌入,并将它们插入到矢量存储中,使 HeatWave Vector Store 高效且易于使用。使用 RAG 的向量存储有助于解决幻觉挑战,LLMs因为模型可以在适当的上下文中搜索专有数据,以提供更准确和相关的答案。
-
横向扩展向量处理可提供非常快速的语义搜索结果,而不会损失任何准确性。HeatWave 支持新的原生 VECTOR 数据类型和距离函数的优化实现,使客户能够使用标准 SQL 执行语义查询。HeatWave 的内存中混合列式表示和横向扩展架构使矢量处理能够在近内存带宽下执行,并在多达 512 个 HeatWave 节点之间并行化。因此,客户的问题可以快速得到解答。用户还可以将语义搜索与其他 SQL 运算符结合使用,例如,将多个表与不同的文档联接起来,并跨所有文档执行相似性搜索。
-
HeatWave Chat 是 MySQL Shell 的可视化代码插件,它为 HeatWave GenAI 提供图形界面,使开发人员能够以自然语言或 SQL 提出问题。集成的 Lakehouse Navigator 使用户能够从对象存储中选择文件并创建矢量存储。用户可以搜索整个数据库,也可以将搜索限制为文件夹。HeatWave 使用所提问题的历史记录、源文档的引用以及对 .LLM这促进了上下文对话,并允许用户验证 LLM.此上下文在 HeatWave 中维护,可用于使用 HeatWave 的任何应用程序。
矢量存储创建和向量处理基准
使用 HeatWave GenAI 为 PDF、PPT、WORD 和 HTML 格式的文档创建向量存储的速度提高了 23 倍,而使用 Amazon Bedrock 知识库的成本则提高了 1/4。
正如第三方基准测试在大小从 1.6GB 到 300GB 不等的表上使用各种相似性搜索查询所证明的那样,HeatWave GenAI 比 Snowflake 快 30 倍,成本低 25%,比 Databricks 快 15 倍,成本低 85%,比 Google BigQuery 快 18 倍,成本低 60%。
单独的基准测试显示,Amazon Aurora PostgreSQL 中带有 pgvector 的向量索引可能具有高度的不准确性,并且可能会产生不正确的结果。相比之下,HeatWave 相似性搜索处理始终提供准确的结果,具有可预测的响应时间,以接近内存的速度执行,并且比使用相同数量的内核的 Aurora 快 10 倍到 80 倍。
AMD高级副总裁兼服务器业务部总经理Dan McNamara表示:“我们很高兴能继续与甲骨文公司开展强有力的合作,通过HeatWave GenAI为关键的企业工作负载和数据集提供强大的AI功能和生产力。AMD和甲骨文的联合工程工作使开发人员能够利用由AMD EPYC处理器的核心密度和出色的性价比提供支持的HeatWave GenAI来设计创新的企业AI解决方案。
客户和分析师对 HeatWave GenAI 的其他评论
“我们大量使用数据库内的 HeatWave AutoML 向客户提供各种建议,”EatEasy 首席执行官 Safarath Shafi 说。“HeatWave 对数据库LLMs内和数据库内矢量存储的支持是差异化的,将生成式 AI 与 AutoML 集成的能力为 HeatWave 在行业中提供了进一步的差异化,使我们能够为客户提供新型功能。与 AutoML 的协同作用还提高了LLM结果的性能和质量。
Aiwifi 创始人 Eric Aguilar 表示:“HeatWave 数据库LLMs内、数据库内向量存储、横向扩展内存向量处理和 HeatWave Chat 是 Oracle 非常与众不同的功能,它们使生成式 AI 民主化,并使其使用起来非常简单、安全且成本低廉。“使用 HeatWave 和 AutoML 满足我们的企业需求已经从多个方面改变了我们的业务,Oracle 推出的这项创新可能会刺激一类新应用的增长,客户正在寻找在其企业内容中利用生成式 AI 的方法。”
Constellation Research副总裁兼首席分析师Holger Mueller表示:“HeatWave的工程创新继续实现通用云数据库的愿景。“最新的是生成式 AI,完成'HeatWave 风格',其中包括将自动化的数据库内矢量存储和数据库LLMs内直接集成到 HeatWave 核心中。这使开发人员能够在组合 HeatWave 元素时创建新的应用程序类。例如,他们可以将 HeatWave AutoML 和 HeatWave GenAI 结合到欺诈检测应用程序中,该应用程序不仅可以检测可疑交易,还可以提供易于理解的解释。这一切都在数据库中运行,因此无需将数据移动到外部矢量数据库,从而使数据更加安全。它还使 HeatWave GenAI 以竞争基准测试中证明的一小部分成本实现高性能。
HeatWave
HeatWave 是唯一一款将自动化和集成的生成式 AI 和机器学习集成在一个产品中用于交易和湖仓一体规模分析的云服务。作为 Oracle 分布式云战略的核心组件,HeatWave 可在 OCI 和 Amazon Web Services、Microsoft Azure 上通过 Oracle Interconnect for Azure 以及 OCI 专用区域和 Oracle Alloy 在客户数据中心原生提供。