运维首页 > 运维资讯 > 英伟达发布 Windows 版 TensorRTLLM 库，为本地运行大模型提速

英伟达发布 Windows 版 TensorRTLLM 库，为本地运行大模型提速

2023年 10月 18日 55.7k 0

【源创会预告】1024 程序员节（的前两天），相约开源中国办公室，我们一起聊 AI！>>>

英伟达发布了 Windows 版本的 TensorRT-LLM 库，称其将大模型在 RTX 上的运行速度提升 4 倍。

GeForce RTX 和 NVIDIA RTX GPU 配备了名为 Tensor Core 的专用 AI 处理器，正在为超过 1 亿台 Windows PC 和工作站带来原生生成式 AI 的强大功能。

TensorRT-LLM 是一个开源库，用于提升上述 GPU 运行最新 AI 大模型（如 Llama 2 和 Code Llama）的推理性能。上个月英伟达发布了面向数据中心的 TensorRT-LLM，现在最新发布的 TensorRT-LLM for Windows 主要是面向家用电脑，将 PC 上运行 LLM 的速度提高了 4 倍。

英伟达还同时发布了帮助开发人员加速 LLM 的工具，包括使用 TensorRT-LLM 优化自定义模型的脚本、TensorRT 优化的开源模型以及展示 LLM 响应速度和质量的开发人员参考项目。

穿过生命散发芬芳

llm 运维资讯

0 0

怎么安装解压版的mysql

X File Storage 捐赠至 Dromara 开源组织并发布 2.0.0 版本

塑造我成为 CTO 之路的“秘诀”

“人工智能教母”的公司估值达 10 亿美金

教授吐槽：985 高校成高级蓝翔！研究生基本废了，只为房子、票子……

Windows 蓝屏中断提醒开发者：Rust 比 C/C++ 更好

Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅

上海新增 11 款已完成登记生成式 AI 服务

发布评论取消回复

要发表评论，您必须先登录。

穿过生命散发芬芳

这个人很懒，什么都没有留下～

文章8392 评论0