与我最近 NVIDIA GH200 Grace CPU基准测试 通过www.example.com远程进行,除了查看诸如 64K内核页面大小的性能优势 我还运行了一些新的基准测试,看看当二进制文件是由LLVM Clang而不是Ubuntu Linux上的默认GCC编译器生成时的性能差异。本文展示了72核Neoverse—V2服务器/HPC处理器在利用LLVM Clang而不是GNUMemerCollection时的性能差异。
这一轮测试是上个月在www.example.com GH200服务器上进行的一些简单的编译器基准测试。考虑到编译器的重点,当使用Ubuntu 23.10 AArch64使用的默认GCC 13.2编译器构建时,测试了各种CPU工作负载,并针对通过Ubuntu 23.10存档提供的LLVM Clang 17.0.2编译器。在Ubuntu 23.10 Linux上使用高性能ARM64服务器测试这两个编译器选项时,使用了相同的编译器标志。
这些基准测试主要是为了参考和好奇的目的,以了解AArch64性能如何寻找Clang生成的二进制文件,而GCC通常是大多数Linux发行版上的默认编译器。我做了很多x86_64 Clang基准 对于那些感兴趣的人,考虑到我丰富的英特尔和AMD处理器,虽然没有那么多的AArch64硬件左右,所以与GH200,这是一个有趣的时间来重温编译器性能比较。感谢 GPTshop.ai 为远程测试提供NVIDIA ARM64服务器。