英特尔与Granite Rapids、Falcon Shores&他们的开放软件堆栈@SC23

2023年 11月 16日 70.4k 0

随着SC23超级计算大会今天在丹佛拉开帷幕,英特尔刚刚解除了对一些披露的禁令。

英特尔没有宣布SC23的任何新产品,但正在谈论他们现有的一些CPU、GPU和AI产品,并继续调侃他们的下一代产品,强调他们出色的开源软件工作。

在英特尔新闻发布会上,英特尔简要介绍了仍在研发中的Aurora超级计算机。。。它还没有完全部署。Aurora仍在为2+ExaFLOPS超级计算机进行升级,该超级计算机在一系列延迟后仍在升级中。该系统已完全安装完毕,但仍在进行中。最新的TOP500榜单发布后会有更多详细信息。

英特尔继续强调其数据中心GPU Max系列硬件的巨大成功。

对于科学工作负载,数据中心GPU Max系列运行得非常好。虽然我还没有测试过任何数据中心GPU Max硬件,但不幸的是,即使在
他们的消费者Arc Graphics硬件在完全开源堆栈上的GPU计算方面表现非常好

英特尔还使用SC23来增强他们伟大的高迪2 AI加速器硬件,因为他们声称这是“NVIDIA H100的唯一可行替代品”。与NVIDIA的产品相比,高迪2在每美元性能方面看起来也不错。

高迪3也被调侃为他们将于2024年推出的下一代人工智能加速器,它将具有更多更快的HBM、更大的BF16功能、转向5纳米工艺,并具有更集成的网络功能。

英特尔继续通过其上游Linux内核驱动程序和用户空间中的开源SynapseAI组件支持哈瓦那实验室/高迪硬件。2025年,哈瓦那实验室和英特尔的产品线将在Falcon Shores APU/XPU上融合,形成真正有趣的可能性。

在Xeon可扩展方面,如前所述,第五代Xeon可扩展“Emerald Rapids”处理器将于12月14日推出。Emerald Rapids是对Sapphire Rapids的一项渐进式改进,保持了平台兼容性,但提供了更好的性能和电源效率。明年Granite Rapids将推出更多内核、更高的内存带宽、持续的人工智能改进,以及第一款基于英特尔3的P核至强。

与此同时,英特尔正在展示他们
至强Max 9480
Sapphire Rapids HBM2e性能。不太公平,他们将其旗舰Sapphire Rapids HBM2e部件与
EPYC 9654
对于各种HPC基准。。。更合适的是现有的AMD
EPYC 9684X
Genoa-X处理器的作用与至强Max相似。根据英特尔的基准测试,至强Max 9480的整体速度仅比EPYC 9654热那亚处理器快19%。你可以看到我的一些
Xeon Max基准测试
关于Phoronix与Genoa和Genoa-X的比较。当然,在某些工作负载中,Xeon Max非常有能力和竞争力,而看到第二代Xeon Max将更加有趣,并有望为每个核心提供更大的HBM2e容量,从而开辟更多的可能性。

对于Emerald Rapids,英特尔正在推广在相同功率水平下比Sapphire Rapids提高1.2~1.4倍的性能。以Emerald Rapids为基准肯定会很有趣。

凭借Granite Rapids,英特尔有望在不同领域实现2~3倍的性能提升,从而变得极具竞争力。我已经对英特尔Granite Rapids的基准测试潜力垂涎三尺了。

演讲结束时,英特尔正在讨论他们的开源软件堆栈。他们的开源软件堆栈无需在Phoronix上介绍,并继续以网络上所有出版物中最多的篇幅报道它。。。英特尔每年都会做出无数的开源贡献,不仅让他们自己的硬件受益,而且在其他平台上也同样受益。他们的oneAPI工作非常出色(或
现在是统一加速基金会
作为UXL),除此之外,他们对Linux内核、GCC、LLVM/Cang和其他开源项目的惊人投资。英特尔在开源生态系统方面的贡献无与伦比,尤其是在性能优化和早期硬件启用/引入新的CPU ISA功能方面。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论