OpenBLAS 0.3.26是本周发布的,它是这个开源的基本线性代数子程序(BLAS)库的最新功能更新。
OpenBLAS 0.3.26针对小问题提供了更快的GESV性能,从参考LAPACK代码中引入了各种修复,各种构建系统改进,以及许多特定于体系结构的优化和修复。
在x86_64端,OpenBLAS 0.3.26在不支持AVX-512的情况下修复了Skylake-X和更新目标上的CASUM计算,修复了其他与AVX-512相关的修复,解决了针对GEMv的AVX之前内核中的问题,并加快了Microsoft Windows上的线程管理。
OpenBLAS 0.3.26还修复了ARM64(AArch64)上的几个问题,为Neoverse-V1和其他性能调优提供了一些新的优化,支持Apple M1和更新的Dynamic_Arch构建目标,等等。对于LoongArch64上的几乎所有BLAS函数,还有各种IBM电源优化和新的/改进的优化内核。
有关OpenBLAS 0.3.26版本的下载和更多详细信息,请访问GitHub.