为GCC发布的AMD Zen 5编译器支持确认新的AVX功能&&更多

2024年 2月 10日 71.3k 0


这是一个非常激动人心的星期六早上,AMD刚刚在GNU编译器集合中发布了他们对管道Zen 5处理器支持“znver5”的初始启用补丁!使用GCC 14 由于像往常一样在3月~ 4月发布年度编译器版本的稳定版本,即使英特尔已经在努力工作,但仍然没有看到Zen 5支持,这令人沮丧 清水森林和黑豹湖支持由于几个月前已经有了上游的塞拉森林、花岗岩急流和其他新的CPU目标...井,Granite Rapids于2022年底加入GCC。但是,现在应该及时合并的是最初的AMD Zen 5支持!

英特尔倾向于在产品发布之前很早就向上游提供新的编译器支持,因为GCC只发布了一年一次的主要版本,而LLVM/Clang的发布周期为六个月。再加上Linux发行版计划在一年一度的GCC 3月至4月发布,直到UbuntuXX.10发布后,他们才会默认迁移到新的GCC编译器版本--比如即将推出的Ubuntu24.04LTS已经在GCC 13上设置了。这意味着客户可以更及时地获得英特尔编译器的支持,而AMD倾向于在产品发布后才发布他们的GCC和LLVM/Clang补丁。有时,他们还依赖SuSE编译器工程师来制定公告后的支持。

由于AMD Zen 5产品还没有发布,我一直担心GCC 14可能不会启用任何Znver5,但这个周六早上看到刚刚发布的用于执行初始版本的补丁肯定让我很兴奋-3月=znver5管道工。最值得注意的是,它注意到了Zen 5 ISA功能:

Znver5

AMD系列1AH内核CPU,支持x86-64指令集。(这是超集BMI、BMI2、CLWB、F16C、FMA、FSGSBASE、AVX、AVX2、ADCX、RDSEED、MWAITX、SHA、CLZERO、AES、PCLMUL、CX16、MOVBE、MMX、SSE、SSE2、SSE3、SSE4A、SSSE3、SSE4.1、SSE4.2、ABM、XSAVEC、XSAVES、CLFLUSHOPT、POPCNT、RDPID、WBNOINVD、PKU、VPCLMULQDQ、VAES、AVX512F、AVX512DQ、AVX512IFMA、AVX512CD、AVX512BW、AVX512VVL、XAV512VBF16、X512VBMI、X512VMI2、12NVNI、12V5ALITI、12VVPCVQ、VX512IFMA、AVX512CD、AVX512BW、AVX512VL、XAV512VBF16、XAV512VBMI、X512VMI2、12NVVI、12NVITI、12VVPCVQ、VX512IFMA、AVX512CD、AVX512BW、AVX512VVL、XAV512VBF16、X512VBMI、X512VBI2、12NVVVI、12NNOINVD、PKU、VPCNT、RDPID、WBNOINVD、PKU、VPCLMULQDQ、VAES、AVX512IFMA、AVX512CD、AVX512BW、AVX512VL、XAV512VBF16、XAV512VBMI、X512VVMI2、12NVVVVI、12NVVI、12VVPCVI

在Zen 4上,这证实了AMD Zen 5增加了AVXVNNI、MOVDIRI、MOVDIR64B、AVX512VP2INTERSECT和PREFETCHI。

很高兴看到AVX-512 VP 2 INTERSECT,它自Tigerlake以来一直在英特尔方面被发现。MOVDIRI和MOVDIR 64 B也在Tigerlake之后被发现。PREFETCHI是令人兴奋的,只有在英特尔方面与花岗岩急流。最后,AVX-VNNI是Zen 5的新功能,等同于AVX 512-VNNI的VEX编码。该补丁重申Zen 5(Family 1Ah)CPU具有所有相同的ISA功能,就像我们喜欢Zen 4和Zen 4C一样。没有ISA的差异,谢天谢地,也没有服务器和桌面/移动之间。

针对GCC的AMD Zen 5初始支持现已开始邮件列表但有望很快合并到GCC 14Git。值得注意的是,目前的znver5代码正在重用现有的znver4调度模型,AMD工程师报告说,稍后将添加Zen 5的更新模型。

截至撰写本文时,Znver 5的LLVM/Clang编译器补丁尚未发布,但可能很快就会发布GCC Zen 5补丁,至少在LLVM方面,他们正在处理六个月的发布周期,Linux发行版倾向于更快地推出新的LLVM版本。

很高兴看到AMD在发布之前就推出了对GCC的Zen 5编译器支持!尽管希望未来几代人的准备时间会更长,比如稳定的Linux发行版中的GCC 13现在已经准备好了Granite Rapids CPU目标。与花岗岩急流一起,GCC在2022年底也得到了支持塞拉森林和流星湖也是。在其他编译器CPU启用的消息中,昨晚安培计算发布了适用于LLVM的安培-1B as what is said to be their third-generation core with significant updates over Ampere-1.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论