英特尔的oneDNN神经网络库为月球湖XE2、塞拉森林和GNR做准备

2024年 3月 1日 39.0k 0


英特尔已经发布了oneDNN 3.4作为深度神经网络库的最新版本,它是其oneAPI软件集合的一部分。OneDNN库为PyTorch、MXNet、ONNX Runtime、OpenVINO、MatLab深度学习工具箱等软件提供深度学习原语。

OneDNN CPU和GPU引擎继续支持英特尔内部和外部的各种目标。随着oneDNN 3.4版本的发布,蓝宝石Rapids/Emerald Rapids的性能有了更多的改进,以及即将到来的Xeon Scalable Sierra Forest和Granite Rapids处理器的性能改进。在CPU方面,还有各种AVX2和AVX-512改进、针对MATMUL的一些英特尔AMX性能改进、一些实验性的CPU优化以及许多其他正在进行的调整。

对于非英特尔处理器,oneDNN 3.4增加了对使用MacOS加速库进行构建的支持,以增强Apple Silicon上的性能。

在显卡方面,针对搭载月球湖处理器的英特尔XE2显卡进行了初步优化。英特尔图形支持还包括更好的数据中心GPU Max系列性能、更高的弧形显卡(DG2/炼金术师)性能、改进的英特尔GPU上用于LLM和类似变压器模型的MATMUL性能、改进的与稳定扩散相关的卷积性能、改进的RNN基元性能等。

oneDNN 3.4版本还增加了对英特尔数据中心GPU Max 1550VG的支持,选择性确定性模式支持,累积模式控制以及其他更改。

有关oneDNN 3.4版本的下载和更多详细信息,请访问GitHub。我会有一些新的One DNN基准 soon.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论