英特尔已经发布了oneDNN 3.4作为深度神经网络库的最新版本,它是其oneAPI软件集合的一部分。OneDNN库为PyTorch、MXNet、ONNX Runtime、OpenVINO、MatLab深度学习工具箱等软件提供深度学习原语。
OneDNN CPU和GPU引擎继续支持英特尔内部和外部的各种目标。随着oneDNN 3.4版本的发布,蓝宝石Rapids/Emerald Rapids的性能有了更多的改进,以及即将到来的Xeon Scalable Sierra Forest和Granite Rapids处理器的性能改进。在CPU方面,还有各种AVX2和AVX-512改进、针对MATMUL的一些英特尔AMX性能改进、一些实验性的CPU优化以及许多其他正在进行的调整。
对于非英特尔处理器,oneDNN 3.4增加了对使用MacOS加速库进行构建的支持,以增强Apple Silicon上的性能。
在显卡方面,针对搭载月球湖处理器的英特尔XE2显卡进行了初步优化。英特尔图形支持还包括更好的数据中心GPU Max系列性能、更高的弧形显卡(DG2/炼金术师)性能、改进的英特尔GPU上用于LLM和类似变压器模型的MATMUL性能、改进的与稳定扩散相关的卷积性能、改进的RNN基元性能等。
oneDNN 3.4版本还增加了对英特尔数据中心GPU Max 1550VG的支持,选择性确定性模式支持,累积模式控制以及其他更改。
有关oneDNN 3.4版本的下载和更多详细信息,请访问GitHub。我会有一些新的One DNN基准 soon.