Kimi 开放平台将启动 Context Caching 内测,支持长文本大模型

13天前 22.0k 0

据月之暗面官方消息,Kimi 开放平台 Context Caching 功能即将启动内测,届时将支持长文本大模型,可实现上下文缓存功能——声称“让每个开发者都用得起长文本大模型”。

Context Caching 是由 Kimi 开放平台提供的一项高级功能,可通过缓存重复的 Tokens 内容,降低用户在请求相同内容时的成本。

Kimi 开放平台将启动 Context Caching 内测,支持长文本大模型-1

官方表示,Context Caching 可提升 API 的接口响应速度。在规模化、重复度高的 prompt 场景,Context Caching 功能带来的收益越大。

下面是官方列举的部分业务场景:

  • 提供大量预设内容的 QA Bot,例如 Kimi API 小助手。

  • 针对固定的文档集合的频繁查询,例如上市公司信息披露问答工具。

  • 对静态代码库或知识库的周期性分析,例如各类 Copilot Agent。

  • 瞬时流量巨大的爆款 AI 应用,例如哄哄模拟器,LLM Riddles。

  • 交互规则复杂的 Agent 类应用,例如什么值得买 Kimi+ 等。

公告原文:https://mp.weixin.qq.com/s/anZhObqWPLWZrNQCFv64Ag

相关文章

小明的代码
开源日报 | 微软开源GraphRAG;AI不仅仅是大模型;开源语音模型接近人类水平;中国寻求人类“开源”新方式
deepin 社区月报 | 2024 年 6 月,deepin V23 RC2 发布,还有多款应用更新!
微软 WSL2 过渡至 Linux 6.6 LTS 内核
吵了6年的数据库话题,会在冯若航这里终结吗?
科技巨头的开源 AI 模型是“假开源”

发布评论