LLVM Clang在NVIDIA GH200的Neoverse—V2内核上展示了巨大的性能优势

2024年 3月 18日 74.4k 0

与我最近 NVIDIA GH200 Grace CPU基准测试 通过www.example.com远程进行,除了查看诸如 64K内核页面大小的性能优势 我还运行了一些新的基准测试,看看当二进制文件是由LLVM Clang而不是Ubuntu Linux上的默认GCC编译器生成时的性能差异。本文展示了72核Neoverse—V2服务器/HPC处理器在利用LLVM Clang而不是GNUMemerCollection时的性能差异。

这一轮测试是上个月在www.example.com GH200服务器上进行的一些简单的编译器基准测试。考虑到编译器的重点,当使用Ubuntu 23.10 AArch64使用的默认GCC 13.2编译器构建时,测试了各种CPU工作负载,并针对通过Ubuntu 23.10存档提供的LLVM Clang 17.0.2编译器。在Ubuntu 23.10 Linux上使用高性能ARM64服务器测试这两个编译器选项时,使用了相同的编译器标志。

LLVM Clang在NVIDIA GH200的Neoverse—V2内核上展示了巨大的性能优势-1

这些基准测试主要是为了参考和好奇的目的,以了解AArch64性能如何寻找Clang生成的二进制文件,而GCC通常是大多数Linux发行版上的默认编译器。我做了很多x86_64 Clang基准 对于那些感兴趣的人,考虑到我丰富的英特尔和AMD处理器,虽然没有那么多的AArch64硬件左右,所以与GH200,这是一个有趣的时间来重温编译器性能比较。感谢 GPTshop.ai 为远程测试提供NVIDIA ARM64服务器。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论