AMD发布ROCm 5.7.1与rocBLAS GEMM Tune&漏洞修补

2023年 10月 14日 27.5k 0

AMD于周五发布了ROCm 5.7.1,这是他们对开源GPU计算堆栈的最新标记版本,该堆栈将继续改进,以更好地对抗NVIDIA CUDA和Intel oneAPI。

遵循
ROCm 5.7
ROCm 5.7.1从9月发布,主要是为这个开源GPU计算解决方案的用户提供各种错误修复。ROCm 5.7.1中最值得注意的是引入
rocblas gemm曲调
将rocBLAS作为一种新的实用程序,为每个GEMM问题集找到性能最好的GEMM内核。这个用于查找性能最佳的GEMM内核的命令行工具可以与
ROCBLAS_TENSILE_GEMM_OVERRIDE_PATH
以便随后覆盖默认内核选择。

ROCm 5.7.1还对HIP运行时进行了一些错误修复,对hipSOLVER进行了一些修复,并在整个过程中进行了其他随机修复。

当谈到支持的GPU时,正式的文档中唯一支持的Radeon GPU仍然是Radeon VII。Radeon Pro系列中有Radeon Pro W6800/Pro V620/Pro V11。对于AMD Instinct硬件,它是Instinct MI250X/MI250/MI210/MI100/MI50,然后MII25支持即将退役。遗憾的是,无论是Radeon PRO W7000系列还是消费者Radeon RX 7000系列,仍然没有官方宣传的RDNA3支持。AMD正在努力扩展其支持的硬件,并应提供更广泛的RDNA3 GPU支持。但至少在ROCm 5.7.1中的文档中,仍然没有提到支持,尽管一些用户报告它在不同程度上起作用。希望在下一个主要的ROCm发布之前,RDNA3 GPU的支持和兼容性预期将得到澄清。

要下载ROCm 5.7.1或了解有关此点发布的更改的更多信息,请访问
rocm.docs.amd.com
.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论