LLVM Clang在NVIDIA GH200的Neoverse—V2内核上展示了巨大的性能优势

运维资讯 2024-03-18 Escape 手机阅读

与我最近 NVIDIA GH200 Grace CPU基准测试通过www.example.com远程进行，除了查看诸如 64K内核页面大小的性能优势我还运行了一些新的基准测试，看看当二进制文件是由LLVM Clang而不是Ubuntu Linux上的默认GCC编译器生成时的性能差异。本文展示了72核Neoverse—V2服务器/HPC处理器在利用LLVM Clang而不是GNUMemerCollection时的性能差异。

这一轮测试是上个月在www.example.com GH200服务器上进行的一些简单的编译器基准测试。考虑到编译器的重点，当使用Ubuntu 23.10 AArch64使用的默认GCC 13.2编译器构建时，测试了各种CPU工作负载，并针对通过Ubuntu 23.10存档提供的LLVM Clang 17.0.2编译器。在Ubuntu 23.10 Linux上使用高性能ARM64服务器测试这两个编译器选项时，使用了相同的编译器标志。

LLVM Clang在NVIDIA GH200的Neoverse—V2内核上展示了巨大的性能优势-每日运维

这些基准测试主要是为了参考和好奇的目的，以了解AArch64性能如何寻找Clang生成的二进制文件，而GCC通常是大多数Linux发行版上的默认编译器。我做了很多x86_64 Clang基准对于那些感兴趣的人，考虑到我丰富的英特尔和AMD处理器，虽然没有那么多的AArch64硬件左右，所以与GH200，这是一个有趣的时间来重温编译器性能比较。感谢 GPTshop.ai 为远程测试提供NVIDIA ARM64服务器。

Wayland&#039；s Weston 13合成器计划下个月发布

Redox操作系统移植了更多Linux软件，包括COSMIC应用程序

LLVM在瞄准AMD Zen优化时处理AMD CPU上较慢的性能

Oracle 致力解决 Java 虚拟线程“Pinning”问题

KDE等离子5.27为Windows带来微妙轮廓