在超级计算SC23周之前,这个领先的开源基本线性代数子程序库发布了新版OpenBLAS。OpenBLAS 0.3.25为Intel和AMD x86_64 CPU带来了新的改进,以及一些常规改进,并对其他架构(如ARM64、POWER和LoongArch)进行了持续调整。
OpenBLAS 0.3.25为这个BLAS库带来了一些一般性的改进,修复了Cray CCE编译器的构建,从即将发布的LAPACK 3.12参考库中移植了一些更改,然后进行了各种特定于体系结构的改进。
对于英特尔CPU,添加了针对?搭载Sapphire Rapids和Cooper Lake处理器的华硕。对于AMD CPU,有一个修复AMD Ryzen Zen 3和Zen 4处理器的编译时自动检测。
在ARM64方面,有各种修复程序,IBM POWER有许多不同的修复程序,然后64位LoongArch添加了优化的SGEMV和DTRSM内核。
有关OpenBLAS 0.3.25版本的下载和更多详细信息,请访问
GitHub
.