Oracle提向量数据库意味着什么

2023年 10月 26日 56.2k 0

在今年举办的Oracle全球大会上,Oracle一如既往强调了几个关键词:数据库、云、人工智能。但与往常有所不同的是,2023年初AIGC生成式人工智能技术的概念渗透和应用创新,正潜移默化影响着业内做法,GPU算力、数据库、云与网络、SaaS应用等等方面,且路径可能不止一种,这自然包括Oracle公司。

Oracle的路径

本次大会上提到的其中一项核心升级,也是业内近段时间十分关注的向量数据库技术。目前Oracle在其最新数据库版本Database 23c中添加了使用AI向量的语义搜索功能。据官方介绍,此功能集合包括新的向量数据类型、向量索引和向量搜索SQL运算符,使Oracle数据库能够将文档、图像和其他非结构化数据的语义内容储存为向量,并以此快速运行相似性查询。

这与23c版本所倡导的理念“App Simple(简化应用)”一致,即简化所有应用和分析的开发与运行,借助生成式AI能力,让Oracle数据库自动生成应用和SQL语言,进一步简化开发,甚至能够做到低代码、无代码开发。

钛媒体注意到,在国内企业市场,通过“AI+低代码”实现企业开发效率和质量极大提升的策略,已经在一些场景中得到实践。从低代码到无代码(全员开放)的过渡,恰需要人工智能技术,这个过程可以是:先将自然语言通过指令生成SQL语言,其次再通过低代码平台生成应用,经过不断调整优化,这时自然语言生成的代码也会逐渐贴合于编程语言。

在此之前,Oracle提出的自治数据库,利用机器学习技术,就可支持自然语言查询。这个场景中,开发人员还可以用自然语言与Oracle数据库“对话”,就可以通过调用生成式AI的能力,把SQL展示出来。

而此次Oracle推出集成向量数据库,也是看到了开发人员在大模型训练过程中存在的挑战。据甲骨文公司中国区技术咨询部高级总监李珈解释,“如果只是做类似于ChatGPT的聊天、查询等功能,无法产生企业级价值。对于企业级场景,只用ChatGPT远远不够,向量数据库是必须的。”

在她看来,大模型运行过程中因为上下文记忆的缺失,导致无法记住之前问过的问题,因此生成的数据也不具备商业意义;使用上向量数据库后,需要从生成效率、噪音数据处理、存储压缩算法等性能方面进行处理;此外还有企业私有数据怎么进行模型训练的问题,私有化的算力也会面临不足。

Oracle原来的数据库可以处理整个结构化数据,也能处理一些非结构化数据。但现在更好的一个能力是,将AI向量检索与客户的业务数据相结合的检索,通过数据向量化处理,回到Oracle数据库,再以向量方式进行查询,如近似查询、模糊查询。

为了实现这一点,Oracle重新设计了向量数据库的表格式(向量表Vector Table),包括语法、函数、索引等。同时,支持RAG(Retrieval Augmented Generation,检索增强生成)技术,将大模型和私有商业数据相结合,以回答自然语言问题。(RAG的原理在于,可提供更高准确性,并通过将私有数据包含在大模型训练数据中来避免泄露私有数据。)

李珈进一步解释,目前向量数据库集成在Oracle的融合数据库里,跟之前单独的图数据库、文档数据库它集成在一起。其优势是除了性能、存储拓展、安全性等方面外,最核心的是能够发挥整个数据库的整体能力,同时跟其他数据库之间做快速的集成,利用一部分存储于Oracle数据库的数据,给出一个有商业价值的结果。

客户需要向量数据库做什么

在什么情况下,客户会考虑用上向量数据库?很长一段时间可能都会存在“好”与“更好”产品组合的策略切换。为此,我们还能够看到,成本似乎也成为数据库细分市场不能绕过的一个话题。

随着技术预算的审查,企业IT正寻找经济高效的数据库解决方案,同时又不影响性能和功能。透明的定价模式和必要的优化工具开始提上日程。只不过,每个厂商都在声称自身服务比另一个更便宜,尤其对大企业客户还会提供业内早已熟悉的折扣套路。

Oracle首席执行官Safra Catz在今年的全球大会上也提及了客户成本方面。据她所述,Oracle通过在构建云方式上的改变使其成本更低。策略之一包括“在近些年投资建设较小规模数据中心,更轻的硬件占用空间和云实施可实现成本节约和可扩展性,较低价格吸引那些正有意向替换或对其采购的IT产品采取成本控制的客户。”

Catz还表示,Oracle正在更多地点建立小型数据中心,以增强其计算能力。在数据中心方面,去年一季度的资本支出达到创纪录的24亿美元。

而在整体云市场,多云是用户市场主流趋势,Oracle认同这一趋势之外,其实已经在与微软、英伟达等进行了越来越多的合作。据外媒,近段时间,Oracle宣布了与微软将深化长达四年的合作伙伴关系,让客户更容易在微软数据中心使用其数据库。例如,艾默生同时使用了Oracle和微软的云,期望两家公司“保持彼此诚实”。

德意志银行分析师Brad Zelnick表示,“Oracle的战略非常明确,它以非常有竞争力的价格优势,去换取市场份额。”Oracle表示,根据2020年的数据,它比AWS便宜61%,比Google云便宜38%。根据一位客户对最近五年的预测,Oracle声称其竞争对手的服务费用是其两倍以上。

例如,Uber根据价格和技术能力对供应商进行了11个月的审查后,选择了Oracle和谷歌。相关人士评论,“超大规模提供商之间的竞争确实让(客户)受益,这种方式性价比更高。”

另一方面,Oracle依靠与英伟达合作保持在人工智能算力方面的优势,根据路透社消息,Oracle于上月提交的委托书中,Oracle同意预付1.041亿美元购买初创公司Ampere生产的处理器芯片。据悉,Ampere基于Arm构建定制服务器芯片,与使用X86的英特尔和AMD存在竞争关系。

外媒分析师评论,对于投资和采购Ampere芯片背后的目的之一,是让Oracle云比竞争对手更具优势。目前AWS、谷歌云都在自研芯片设计。而此次大会上,Oracle宣布基于AmpereOne芯片的OCI Ampere A2机型即将上线,相比X86在性价比方面有了44%的提升。

从数据库存储的关键数据,到算力、人工智能技术的投入,加之原有的品牌影响力和客群、合作伙伴的支撑,这些都构成了Oracle下一个阶段的增长潜力。

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论