运维首页 > 运维资讯 > Kimi 开放平台将启动 Context Caching 内测，支持长文本大模型

Kimi 开放平台将启动 Context Caching 内测，支持长文本大模型

2024年 6月 20日 92.9k 0

据月之暗面官方消息，Kimi 开放平台 Context Caching 功能即将启动内测，届时将支持长文本大模型，可实现上下文缓存功能——声称“让每个开发者都用得起长文本大模型”。

Context Caching 是由 Kimi 开放平台提供的一项高级功能，可通过缓存重复的 Tokens 内容，降低用户在请求相同内容时的成本。

Kimi 开放平台将启动 Context Caching 内测，支持长文本大模型-1

官方表示，Context Caching 可提升 API 的接口响应速度。在规模化、重复度高的 prompt 场景，Context Caching 功能带来的收益越大。

下面是官方列举的部分业务场景：

提供大量预设内容的 QA Bot，例如 Kimi API 小助手。
针对固定的文档集合的频繁查询，例如上市公司信息披露问答工具。
对静态代码库或知识库的周期性分析，例如各类 Copilot Agent。
瞬时流量巨大的爆款 AI 应用，例如哄哄模拟器，LLM Riddles。
交互规则复杂的 Agent 类应用，例如什么值得买 Kimi+ 等。

公告原文：https://mp.weixin.qq.com/s/anZhObqWPLWZrNQCFv64Ag

竹子爱熊猫

cachingcontextkimi 运维资讯

0 0

我国人工智能企业数量已超 4000 家

手把手案例！怎样拿开源的 GPT-2 训练小模型，挑战 GPT-3.5

塑造我成为 CTO 之路的“秘诀”

“人工智能教母”的公司估值达 10 亿美金

教授吐槽：985 高校成高级蓝翔！研究生基本废了，只为房子、票子……

Windows 蓝屏中断提醒开发者：Rust 比 C/C++ 更好

Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅

上海新增 11 款已完成登记生成式 AI 服务

发布评论取消回复

要发表评论，您必须先登录。

竹子爱熊猫

这个人很懒，什么都没有留下～

文章8367 评论0