英特尔发布OpenVINO 2024.2与Llama 3优化,更多AVX2&AVX-512优化

2024年 6月 18日 56.4k 0

英特尔发布OpenVINO 2024.2与Llama 3优化,更多AVX2&AVX-512优化-1英特尔今天发布了OpenVINO 2024.2,这是其开源人工智能工具包的最新版本,用于在一系列人工智能框架和广泛的硬件类型中优化和部署深度学习(A)推理模型。

通过OpenVINO 2024.2,他们继续优化Meta的Llama 3大型语言模型。OpenVINO 2024.2为跨CPU、集成GPU和离散GPU的执行带来了更多的Llama 3优化,以进一步提高性能,同时提高内存使用效率。

OpenVINO 2024.2还增加了对Phi-3-mini AI模型的支持、更广泛的大型语言模型支持、对Intel Atom Processor X系列的支持、对英特尔至强6处理器的预览支持,以及更多AVX2/AVX-512调优。英特尔发现,在利用小批量时,英特尔酷睿CPU上的AVX2和英特尔至强处理器的AVX-512的FP16重量LLM在第二令牌延迟和内存占用方面有了“显著改善”。

英特尔发布OpenVINO 2024.2与Llama 3优化,更多AVX2&AVX-512优化-2

Downloads and more details on the OpenVINO 2024.2 release via GitHub.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论