点击上方蓝字关注我们
行业快讯与友商动态 2024年第22期:
大模型应用渐成冲击波,引领科技变革新浪潮。Oracle高调发布Exadata Exascale,重塑数据库处理巅峰。
Informatica携手Databricks,GenAI合作开辟数据智能新径。知识图谱融合RAG,信息检索绽放智慧花朵。
RPA融合AI,自动化跃进智能代理新时代,各行各业迎来智能升级新动力。
本周焦点
1.无涯·问知入选2024 WAIC大模型典型示范应用案例集
2.重磅发布:《2024大模型典型示范应用案例集》,纵览最新最全产业应用实践!
3.万字长文!看大公司如何开发大模型智能应用
大数据
4.【TDH社区版大事件】图分析、全文检索、小文件治理、数据开发工具通通都有!
5.TuGraph-DB支持空间数据类型
6.Oracle 宣布推出全球唯一的云智能数据架构 Exadata Exascale
7.Tinybird为实时分析项目筹集3000万美元,为实时分析项目提供支持的平台
8.Informatica推出面向Databricks的新产品创新和企业级生成式AI蓝图
9.高性能开源分布式文件系统提供商Alluxio宣布一系列增强功能,实现97%的GPU利用率
10.Hebbia筹集1.3亿美元用于开发数据搜索平台
11.从数据时代到智能时代,星环科技&信雅达联合发布金融全栈解决方案
数据库
12.《中国数据库产业图谱(2024)》发布,星环科技入围多个领域
13.华为云发起的云原生高性能时序数据库openGemini成为CNCF项目!
14.Tembo筹集1400万美元用于运营PostgreSQL托管服务
15.开源KV数据库PikiwiDB(Pika) v4.0.0正式发布
数据安全
16.Tracebit获得500万美元以促进网络威胁探测
17.隐私计算& AI技术融合!蚂蚁集团正式推出“隐语Cloud”大模型密算平台,加速产业大模型深度应用
AI
18.tidb.ai使用知识图谱增强RAG能力
19.博云牧品Folib制品库为企业提供一种全新、安全、可信的AI模型仓库
20.AI驱动检察,云从科技发布智能审查大模型
21.Celonis与Emporix联合发布新型编排引擎,旨在实现端到端流程自动化
22.Automation Anywhere推出新一代AI+自动化企业系统,助力企业实现10倍商业增长
23.Milvus集成DSPy,搭建高效RAG Pipeline
本周焦点
1.无涯·问知入选2024 WAIC大模型典型示范应用案例集
近日,在2024世界人工智能大会“迈向 AGI:大模型焕新与产业赋能”论坛上,《2024大模型典型示范应用案例集》(以下简称《案例集》)重磅发布!星环科技无涯·问知Infinity Intelligence成功入选《案例集》。
作为以产业化为导向的重磅前沿研究成果,《案例集》展示了最新最全的大模型创新融合应用发展成果,推动了大模型为代表的人工智能前沿技术赋能千行百业,推动社会经济高质量发展。
无涯·问知是一款基于星环科技自研预训练模型无涯Infinity和向量数据库Hippo、图数据库StellarDB构建的企业级垂直领域问答知识库应用。无涯·问知支持不限长度的音视频图文等多模态数据快速入库,且支持自动化文档切片及向量化处理,配合自研的RAG框架,可实现知识的精准召回。无涯·问知具备了泛行业的知识获取能力、专业的内容理解能力及数据分析能力,可用于市场研究分析、企业供应链分析、法律风险预警、设备故障诊断等丰富的业务场景中。
2.重磅发布:《2024大模型典型示范应用案例集》,纵览最新最全产业应用实践!
7月5日,在2024世界人工智能大会“迈向 AGI:大模型焕新与产业赋能”论坛上,《2024大模型典型示范应用案例集》(以下简称《案例集》)重磅发布!
2024年,我国将人工智能的发展上升为国家战略,大模型的产业化应用落地进一步提速。作为以产业化为导向的重磅前沿研究成果,《案例集》展示了最新最全的大模型创新融合应用发展成果,推动了大模型为代表的人工智能前沿技术赋能千行百业,推动社会经济高质量发展。
《案例集》自4月份启动征集以来,得到行业积极关注响应,共计收到各领域有效案例数百个。经专家组的多轮评审,综合考虑案例所属领域、应用需求、创新能力、社会效益、应用前景等多方面因素,进行全面评估,最终评选出99个优秀应用案例。
3.万字长文!看大公司如何开发大模型智能应用
从 BERT、GPT、T5 等通用大模型展示了令人瞩目的语言理解和 NLP 任务解决能力,到 ChatGPT 惊艳发布,再到国产大模型的百花齐放,我们目睹了大模型通过海量参数和强大的学习能力,不仅在问答、对话、摘要、翻译等任务上取得了不错的成果,更是推动了人工智能的边界不断扩展。
而在百模大战之后,国内也迅速进入应用爆发的阶段,无论是创建逼真的聊天机器人、GPTs,还是垂直行业的大模型工程实践,这些应用都展示了大模型在实际场景中的巨大潜力。
在 7 月 4 -5 日于北京正式拉开帷幕的 2024 全球软件研发技术大会(SDCon)上,我们特设的“大模型智能应用开发”论坛,邀请了来自腾讯、去哪儿、京东、美图、eBay、衍数科技、宾夕法尼亚州立大学的一线技术专家和行业领袖,深度探讨智能应用最新的研究成果和开发经验。同时,我们期待与会者能够在这场思想的盛宴中,获得启发与洞见,推动自身及整个行业的创新与发展。
大数据
4.【TDH社区版大事件】图分析、全文检索、小文件治理、数据开发工具通通都有!
https://mp.weixin.qq.com/s/sjhzw8CpLC0zXLff3H9T5w
星环科技大数据基础平台TDH社区版,在保留了商业版核心技术优势的基础上最大程度地降低了用户使用大数据技术的门槛与成本,具有更轻量、更简单、更易用等特性。
此次TDH社区开发版、社区版、社区订阅版均发布了新版本,带来新的产品组件和新的功能,为用户提供更为便利、简单、易用的大数据平台产品。
5.TuGraph-DB支持空间数据类型
近年来,地理数据类型/空间数据类型(Spatial Data Type)在图数据库中的应用价值显著,它不仅增强了数据的表达能力,还促进了跨领域数据的融合分析,尤其在社交网络、地图探索、城市规划等关键领域展现了强大的实用价值。
自北京大学的TuGraph开源社区开发者孙同学的工作,基于开源图数据库TuGraph-DB的开发,支持了空间数据类型。未来,TuGraph-DB将来会继续实现Disjoint() 、WithinBBox()等更多的函数,以及实现更高级的索引、数据导入、可视化等功能,丰富更多的使用场景。
6.Oracle 宣布推出全球唯一的云智能数据架构 Exadata Exascale
Oracle 宣布全面推出 Exadata Exascale,这是一款面向云的智能数据架构,可为任何规模的所有 Oracle 数据库负载(包括 AI 矢量处理、分析和事务)提供极致性能。
Exadata Exascale 可显著降低任何规模的组织利用 Oracle Exadata 独特的内置性能、可靠性、可用性和安全功能的成本。Exadata Exascale 现已与基于 Exascale 基础设施的 Exadata 数据库服务和基于 Oracle 云基础设施 (OCI) 的 Oracle Database 23ai 一起提供。未来,它将在 Exadata Cloud@Customer、OCI 专用区域和多云环境中提供。
“Exadata Exascale是Exadata为多租户、超弹性云而重新构想的,是所有Oracle数据库云服务的未来架构。Exadata Exascale 将基础设施成本降低多达 95%,使小型工作负载和小型企业能够利用 Oracle Exadata for Oracle Databases 在云中的优势。
7.Tinybird为实时分析项目筹集3000万美元,为实时分析项目提供支持的平台
初创公司Tinybird Inc.在最新一轮融资中筹集了3000万美元。它开发了一个为实时分析项目提供支持的平台。
Tinybird 提供预打包连接器,以便从组织的系统实时收集数据。开发人员可以根据需要将该数据与过去的信息合并。例如,网络安全应用程序可以将可能与事件相关的先前用户行为的历史信息包含在即时违规警报中。
Tinybird 的平台可以在几毫秒内完成某些通常需要几秒钟的分析操作。这使应用能够更快地响应新数据。该平台的性能是企业创造的多项速度增强的结果。
经常询问的查询结果可以通过称为“具体化视图”的功能进行缓存,这样就无需在每次需要时从头开始计算结果。这样一来,开发人员就可以减少应用等待查询的时间。Tinybird声称该功能可以处理数十亿行数据。
此外,该公司还提供一项称为 JWT for API Endpoints 的服务,该服务加快了来自客户应用程序的数据请求到达其平台所需的时间。此类查询通常需要通过中间人(例如代理)才能到达 Tinybird 的平台。通过消除对中间人应用程序的要求,API 端点的 JWT 最大限度地减少了延迟。
8.Informatica推出面向Databricks的新产品创新和企业级生成式AI蓝图
Informatica扩大与 Databricks的合作伙伴关系,推出新的产品功能和产品,将Informatica的 AI 驱动的智能数据管理云(IDMC)平台功能全方位整合到Databricks 中数据智能平台。扩大的合作伙伴关系将使客户能够基于高质量、可信的数据和元数据,大规模部署企业级生成式人工智能(GenAI)应用程序。
扩大的合作伙伴关系包括四项新功能:
·面向Databricks DBRX的GenAI解决方案蓝图 - Informatica的Databricks GenAI 蓝图为客户提供了使用 Databricks DBRX 开发基于检索增强生成 (RAG) 的GenAI 应用程序的路线图。Databricks DBRX是一个开放的通用大型语言模型 (LLM),旨在使用户能够开发企业级GenAI 应用程序。该蓝图允许客户构建基于RAG的GenAI解决方案,利用Informatica的IDMC无代码/低代码界面和元数据驱动的智能以及用于嵌入数据的Databricks Vector Database,从而实现对可信和可操作的数据洞察的大规模访问。
·本机Databricks SQL ELT–本机 SQL ELT 将使用户能够利用本机 Databricks 功能(如 AI 驱动的助手)和无服务器计算,在 Databricks SQL(智能数据仓库)上执行具有完整的下推功能的数据库内转换。这将允许客户开发 ETL 管道以在 Databricks 计算上运行,以实现 AI 优化的性能、可缩放的数据转换和集成。
·Databricks Partner Connect上的无云数据集成服务(CDI-Free) - Informatica 的无 CDI 产品现已通过 Databricks Partner Connect提供,使客户能够快速轻松地免费访问 Informatica 的云数据引入和转换功能。CDI-Free via Partner Connect为用户提供每月多达2000万行数据或10个ELT计算小时的ELT处理。
·通过Unity Catalog提供全面的 IDMC 支持 - Informatica IDMC平台现已通过Databricks Unity Catalog进行全面验证,Databricks Unity Catalog是Databricks平台中数据和AI的统一治理层。与 Unity Catalog 的集成包括所有关键的 IDMC 服务,并大大增强了 Informatica 在IDMC平台上管理数据沿袭和治理的能力。
9.高性能开源分布式文件系统提供商Alluxio宣布一系列增强功能,实现97%的GPU利用率
销售高性能开源分布式文件系统提供商Alluxio宣布了一系列增强功能,以优化昂贵的图形处理单元的使用,同时进行性能改进,使其存储性能与针对高性能计算优化的存储子系统竞争。
Alluxio Enterprise AI 3.2版本还增加了Python界面和改进的缓存管理功能,这些有助于组织更好地利用人工智能训练和推理基础设施。
Alluxio为企业提供了一个单一的控制点,以处理跨不同基础设施的数据密集型工作负载。新版本使用统一的命名空间、智能缓存和数据管理,即使在远程数据的情况下也能最大限度地提高 GPU 利用率。结合缓存管理和选择性过滤方面的存储管理改进,Alluxio Enterprise AI 3.2与现有数据湖上的HPC存储性能相匹配,这是由流行的MLPerf基准测试套件衡量的。
“我们达到了硬件极限的 75%,能够驱动每秒10 吉比特的吞吐量,”Madan 说。“这与市面上最好的 HPC 存储子系统一样好。”
10.Hebbia筹集1.3亿美元用于开发数据搜索平台
Hebbia筹集了1.3亿美元,为企业开发数据搜索平台。Alphabet的GV风险基金也参与其中。Hebbia目前的净资产估计约为7亿美元。
使用自然语言提示,员工可以在以他们的名字命名的平台的帮助下对大量数据进行分类。管理14万亿美元资产的投资公司使用其软件做出明智的财务决策。律师使用该软件来总结大量的法律文件。
该软件以类似于电子表格的方式排列搜索结果。为了响应用户对特定市场中前五名竞争对手的财务业绩的询问,该平台可能会为每家公司生成一个不同的电子表格列。然后,可以将每个公司的列划分为显示有关收入、净利润和每股收益信息的字段。
Hebbia可以检索和分析公司数据。例如,金融分析师可以要求平台根据可行的回报对前十种投资可能性进行评级。房地产专业人士可以利用Hebbia进行财产评估。
该平台使用公司内部记录、监管文件、图表和其他文件来响应员工的要求。它通过将大型语言模型与计算机视觉模型相结合来生成分析。该软件具有一种称为路由机制的功能,可以搜索最佳神经网络来自动处理用户的查询。
一些 LLM 发现执行需要多个阶段的任务具有挑战性。Hebbia声称,其平台通过将复杂的用户请求分解为离散的步骤,并将每个步骤与不同的神经网络相匹配来解决这个问题。该软件使用 OpenAI 的 LLM 来执行一些处理功能。
11.从数据时代到智能时代,星环科技&信雅达联合发布金融全栈解决方案
星环科技与信雅达在金融行业的多个关键领域展开了广泛而深入的合作,推出了一系列面向金融科技领域的联合解决方案。此次合作基于星环科技在大数据、人工智能和云计算领域的先进技术,以及信雅达在金融领域的深厚积累,围绕数字化管理、数字化风控、数字化运营、数字化营销、数字化产融联合打造了金融全栈解决方案,旨在为金融机构提供更加智能化、数据驱动的技术服务。
信雅达影像内容管理平台采用微服务架构、容器云化部署,依托星环科技大数据相关产品实现影像元数据与影像内容数据的统一管理,降低开发成本,大幅提升性能容量,具备随需横向扩展能力,为金融客户提供了一套安全、稳定、灵活、可扩展性强的影像内容集中管理平台。在实现客户转型发展需要、优化业务流程、提高业务处理效率、降低业务处理成本、为基层减负提速等方面为客户提供最优质的服务。
资产负债联合解决方案专注于为客户提供流动性风险和利率汇率风险的一体化解决方案。针对客户在业务持续发展和精细化管理过程中对海量数据存储计算提出的苛刻要求,采用星环科技高性能分布式分析型数据库ArgoDB构建资产负债数据集市和核心计量引擎,实现业务数据特征筛选、数据压缩、现金流拆分、现金流合并,报表基础数据准备等功能,支撑MPA关键指标计量展现、全行经营计划与预算方案等上层应用。
实时风控联合解决方案旨在协助客户识别潜在风险问题,强化系统风险动态监测,提升交易风险预警时效。通过引入星环科技分布式分析型数据库ArgoDB实现高吞吐、低延时的数据集成能力,为客户提供毫秒级的数据同步和秒级的数据查询能力,在客户的实时交易分析、实时数据搜索、实时反欺诈和实时图谱分析的业务场景中,带来更多新增功能。
数据库
12.《中国数据库产业图谱(2024)》发布,星环科技入围多个领域
中国通信标准化协会正式发布《中国数据库产业图谱(2024年)》。星环科技入围分布式事务数据库、分布式分析型数据库、时序数据库等多个领域。
2024版的产业图谱依据申报单位的产品技术、市场份额、知识产权、学术贡献及企业声誉等多维度指标综合评价,共分为数据库主流产品提供商、数据库生态工具提供商、数据库前沿产品提供商、数据库服务商、数据库安全厂商、数据库生态社区、数据库人才培养等领域,其中事务型数据库、分析型数据库和时序数据库方向首次将入选厂商赋予领航者和竞争者的标识。
13.华为云发起的云原生高性能时序数据库openGemini成为CNCF项目!
云原生计算基金会(CNCF)正式接纳由华为云发起的云原生高性能时序数据库项目openGemini。openGemini的加入,极大地丰富了云原生数据库技术的探索、创新和发展。
openGemini自2022年开源至今,受到业界的广泛关注和支持,社区共发展出22个子项目,已收获1000多个GitHub Star和140多个Fork,100多位来自外部企业、高校的开源爱好者参与社区开发贡献,60多家企业和单位测试和落地应用。此次CNCF正式将openGemini接纳为官方项目,将极大促进openGemini的发展。
14.Tembo筹集1400万美元用于运营PostgreSQL托管服务
PostgreSQL托管服务运营商Tembo Data Systems在 A 轮融资中筹集了1400万美元,已将其融资总额提高到2050万美元。
Tembo 致力于通过虚拟运行时体验、访问最大的 Postgres 生态系统和一键式迁移来简化 Postgres 部署。Tembo表示,它计划用额外的资金为开发人员参与、产品开发、广告和新工作提供资金。
PostgreSQL 是最流行的数据库管理系统之一。去年,Stack Overflow Internet Services Inc. 的年度民意调查将其列为最受欢迎、最受好评和最受欢迎的数据库。在SolidIT Consulting & Software Development GmbH的DB-Engines网站中,它在DBMS中排名第四。
15.开源KV数据库PikiwiDB(Pika) v4.0.0正式发布
该版本经过9 个月打磨并在生产环境稳定运行 5 个月,基于第三代存储引擎 Floyd(基于 RocksDB),支持String、Hash、List、Set、Stream及 ZSet等复合数据结构.
Floyd 如同其前代 Blackwidow,基于 RocksDB,不仅支持基础的 String 结构,也原生支持了 Hash、List、Set、Stream及 ZSet 等 KKV 形式的复合数据结构。
Pika 团队开发了批量查询热数据缓存功能,显著提升了批量查询性能,降低了查询延迟和失败率。
对 Pika 全量复制及增量复制进行了大量优化和 bug 修复,取得了非常好的效果。Redis Stream 类似于消息队列(MQ),以便更安全地传递消息。为了确保数据的安全性,底层引擎 BlackWidow 和 Floyd 中特别添加了对 Stream 数据类型的支持。
推理在密态形式下的响应时间和使用效率与明文大模型接近,实现大规模商业可用。
数据安全
16.Tracebit获得500万美元以促进网络威胁探测
总部位于英国的“威胁探测”初创公司 Tracebit 已获得500万美元的种子资金,以促进以前为前1%的安全团队保留的网络安全技术的广泛采用。
Tracebit开发了一个基于云的威胁探测平台,允许公司设置“金丝雀”,这是虚假的“蜜罐”,旨在引诱黑客暴露自己。这些金丝雀可帮助安全团队检测其系统中的威胁,了解黑客行为,并发现其网络防御中的漏洞。
通过部署金丝雀,安全团队可以引诱恶意行为者并在行为中抓住他们。如果执行得当,这种威胁欺骗技术可以非常有效。Tracebit 强调研究表明,当攻击者意识到受感染系统中存在金丝雀时,网络攻击的有效性会大大降低,进展也会更慢。
17.隐私计算& AI技术融合!蚂蚁集团正式推出“隐语Cloud”大模型密算平台,加速产业大模型深度应用
2024WAIC期间,蚂蚁集团发布“隐语Cloud”大模型密算平台,聚焦密算技术在AI大模型领域的创新实践,破解高质量数据供给及安全性的挑战。通过软硬件结合的可信隐私计算技术,在大模型托管和大模型推理等环节实现数据密态流转,保护模型资产、数据安全和用户隐私,让大模型能够向下扎根深入行业,真正推进产业应用与价值赋能。
“隐语Cloud”大模型密算平台首批推出两大服务,分别为大模型密态托管和大模型密态推理。大模型密态托管,指模型提供方可以将模型加密后托管在平台上,一键完成云上密态部署,保护模型资产不被泄漏和盗用;大模型密态推理,是指数据以密态形式完成推理,保护用户交互时的数据安全、商业机密等。此外,该平台支持 GPU 在可信执行环境下进行计算,使得大模型推理在密态形式下的响应时间和使用效率与明文大模型接近,实现大规模商业可用。
AI
18.tidb.ai使用知识图谱增强RAG能力
tidb.ai 是一个AI问答机器人,旨在解决TiDB社区用户提出的技术问题,提高响应速度和用户体验。在此之前, tidb.ai 面临了一些挑战:
社区用户之前需要等待技术支持工程师解答问题,过程可能耗时且效率不高。
TiDB文档虽丰富,但用户难以快速获取全面认知。
为此,tidb.ai 使用知识图谱增强 RAG能力。知识图谱(KGs)与大型语言模型(LLM)的集成有望显著增强检索增强生成(RAG)过程,从而改进知识表示和推理。这种协作方法有助于动态知识融合,确保真实世界的知识保持最新,并与文本空间不同。因此,在推理过程中提供的信息仍然是最新的和相关的。
19.博云牧品Folib制品库为企业提供一种全新、安全、可信的AI模型仓库
越来越多的企业倾向于将AI模型存储在私有化的仓库中,以确保数据的安全性和隐私保护。
博云牧品Folib制品库的AI模型仓库能力,正是在这样的背景下应运而生,旨在为企业提供一种全新、安全、可信的AI模型仓库。Folib制品库的AI仓库支持Hugging Face类型的模型存储、版本控制、依赖管理、数据安全和访问权限等方面的能力,并进行企业私有化托管,来保障模型的安全性和可追溯性。
博云牧品Folib制品库,使用通用构件储存库制品管理专有模型。支持AI模型代理和镜像功能,要从Hugging Face下载或是存取第三方模型时,只需通过企业内部的Folib制品库执行获取,以一个中央管理的方式,规避内部人员在非安全渠道下载带来的隐藏风险。确保了数据的完全控制,避免了数据外泄的风险。同时通过Folib制品库完善的访问控制和加密存储机制,保障企业数据在传输和存储过程中的安全性。
相比于依赖第三方云服务,私有化仓库能够显著降低长期使用成本。企业无需支付高昂的云服务费用,且可以自主决定硬件和存储资源的使用,优化资源配置,降低总体拥有成本(TCO)。
20.AI驱动检察,云从科技发布智能审查大模型
云从科技在会上发布从容智能审查大模型方案。当前社会法治建设逐步完善,司法领域审查需求与日俱增,检察院现有配置难以支撑,为解决审核量大、审查点多、规则复杂等行业痛点,云从科技推出基于自研的从容大模型及一体化平台开发设计的寻知智能审查一体机,是西部首个聚焦检察院办案领域,着力提高检察院办案效率的AI智能体。
智能审查大模型应用场景包括分析、理解行业知识和校验规则,实时提醒用户文书需注意部分,全文校验格式、内容和逻辑错误,定位修订位置,并提供修正指导等。
考虑到国家信息安全和自主可控的要求,云从科技的从容智能审查大模型完全支持国产信创标准,与国内主流软硬件及中间件实现了全面适配,确保了系统的安全性和稳定性,同时也降低了部署和使用的门槛。
21.Celonis与Emporix联合发布新型编排引擎,旨在实现端到端流程自动化
Celonis与Emporix联合推出一款新平台,旨在为企业提供端到端的流程自动化能力。虽然许多组织已经利用机器人流程自动化(RPA)来自动化诸如计算价格或生成报价等简单任务,而新推出的编排引擎则使企业能够进一步完全自动化“销售”或“采购”等流程。
编排引擎的核心作用在于整合并指导组织内常见的、往往孤立的简单流程或任务。例如,它不仅能自动化销售流程中的报价生成,还能通过Celonis流程智能图中的上下文感知,自动化整个销售流程——从生成报价、发送报价给客户、创建订单、发货、开具发票、将发票发送给客户到接收付款的全过程。
编排引擎利用Celonis流程智能平台的洞察力(称为触发事件),能够实时响应并启动一系列跨系统和工具的分层动作。通过定制的执行模板,它可以协调这些动作,以优化特定商业目标的性能,Celonis表示这使得该引擎能够通过监控实际流程执行不断学习和调整。
22.Automation Anywhere推出新一代AI+自动化企业系统,助力企业实现10倍商业增长
RPA厂商纷纷进军AI Agent ( AI 代理)领域,陆续推出创新产品。最近,Automation Anywhere宣布推出其新的AI + 自动化企业系统,该系统结合AI和自动化技术,以实现指数级的业务成果。
这款新产品,融入了公司的第二代GenAI流程模型,加速AI流程自动化的发现、开发和部署。公司还推出了新的AI代理,以管理复杂的认知任务,并在企业的每一个系统中实现前所未有的自动化水平。
这些解决方案将帮助组织实现显著的效率提升,将原本需要数小时的流程任务缩短至数分钟,实现三倍的时间价值和高达十倍的业务影响,涵盖客服运营、财务、IT和人力资源等业务流程。
23.Milvus集成DSPy,搭建高效RAG Pipeline
与LLMs互动的过程中,最核心的部分是提示(prompt)。Prompt是指用于指导这些模型执行特定任务的命令。然而,制定有效的Prompt是一个细致且复杂的过程,常需借助如思维链(Chain-of-Thought)和 ReAct 等高级技术。
DSPy为开发者与语言模型互动方式带来了变革——通过引入一个可编程接口,实现了模型 Prompt和权重的算法优化,从而帮助相关人员更高效地开发语言模型。DSPy已支持无缝集成 Milvus向量数据库,通过程序化方法自动优化检索增强生成(RAG)应用。
DSPy是由斯坦福NLP组推出的一种程序化框架,旨在优化语言模型中的Prompt和权重,这在LLM跨多个pipeline阶段集成时尤其有用。它提供了各种可组合和声明式模块,以 Python 语法指导LLM。
与依赖手动制作和调整提示的传统提示工程技术不同,DSPy 学习查询-答案示例,并模仿这一学习过程来生成为特定结果量身定做的优化提示。这种方法允许动态重组整个pipeline,精确地针对任务的细微差别进行定制,从而免去了开发人员持续手动调整提示的麻烦。
关注我们
END