OpenBLAS 0.3.25为Sapphire Rapids&更多

2023年 11月 16日 41.2k 0

在超级计算SC23周之前,这个领先的开源基本线性代数子程序库发布了新版OpenBLAS。OpenBLAS 0.3.25为Intel和AMD x86_64 CPU带来了新的改进,以及一些常规改进,并对其他架构(如ARM64、POWER和LoongArch)进行了持续调整。

OpenBLAS 0.3.25为这个BLAS库带来了一些一般性的改进,修复了Cray CCE编译器的构建,从即将发布的LAPACK 3.12参考库中移植了一些更改,然后进行了各种特定于体系结构的改进。

对于英特尔CPU,添加了针对?搭载Sapphire Rapids和Cooper Lake处理器的华硕。对于AMD CPU,有一个修复AMD Ryzen Zen 3和Zen 4处理器的编译时自动检测。

在ARM64方面,有各种修复程序,IBM POWER有许多不同的修复程序,然后64位LoongArch添加了优化的SGEMV和DTRSM内核。

有关OpenBLAS 0.3.25版本的下载和更多详细信息,请访问
GitHub
.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论