在今天的AMD人工智能活动上,该公司为其非常令人兴奋的数据中心APU和CDNA3离散GPU加速器提供了更多关于本能MI300系列的细节。ROCM 6.0也是为了提升AMD的人工智能软件能力而发布的。
有了AMD本能MI300X加速器,他们的目标直接是成为NVIDIA的人工智能加速器的优秀替代品。
除了拥有H100 SXM两倍以上的HBM3内存量外,AMD本能MI300X至少在理论上的峰值潜力应该会超过NVIDIA的竞争对手。MI300X的主板总功率为750瓦。一台服务器最多可集成八个MI300X加速器,可提供1.5TB的HBM3内存,计算能力可能是NVIDIA H100 HGX的1.3倍。
AMD提供的数字似乎在非常好的地位对NVIDIA的H100的竞争。不幸的是,在今天的声明之前没有独立的测试。
我个人最感兴趣的是本能MI300A作为AI和HPC的APU加速器。配备Zen 4 CPU内核、AMD CDNA3显卡和128 GB HBM3统一内存的MI300A在数据中心提供了许多有趣的潜力,作为配备HBM2e内存的蓝宝石Rapids CPU的Xeon Max的替代产品,并领先于英特尔将于2025年推出的Falcon Shores APU。
MI300A拥有24个Zen 4 CPU内核、256MB AMD Infinity高速缓存、8个HBM3堆栈,内存带宽约为5.3 TB/S,以及228个AMD CDNA3计算单元。
AMD的基准测试显示,ROCm工作负载具有出色的HPC和AI性能,能够利用令人难以置信的内存带宽以及CNDA3计算单元和Zen 4 CPU内核的组合。