Lisa Su在推特上发布了关于开源AMD GPU固件的消息后表示,团队正在努力

2024年 3月 6日 33.8k 0


Tiny Corp的George Hotz正在开发Tinygrad和TinyBox,以获得开源人工智能领域的有趣开发,他之前因ROCM问题呼吁AMD.昨天,“小公司”发布了新的推文,内容是人工智能培训运行因MES错误而崩溃,然后呼吁AMD开源AMD首席执行官Lisa Su回应的固件。

小公司在推特上在这些问题上:

目前,我对7900XTX平台的出货不太满意。我们该怎么办?

...

我们不是AMD的QA团队,我们与他们没有任何关系。去年我看到了一些东西,给了我希望,但这个平台已经推出14个月了,仍然存在严重的问题。

MES不是开源的,这让我很不安。虽然比NVIDIA更多的东西是开源的,但如果有斑点,我们就不是硬件的主人,我不觉得把时间花在这上面很好。

今天的编译器错误是锦上添花。起初,我以为这是`Launch_bunds`功能,但看起来没有该功能也可以触发。不能信任编译器会破坏对整个平台的太多信任。

这可能会让我们倒退,但也许我们应该改用3090年代或@intel

图形处理器。无论哪种方式,在这一点解决之前,我们都不会发货(或订购大宗7900XTX)。

...

我相信@AMD也不想要这些错误,但他们关注的地方错了。

他们应该立即停止开发高端ML库,并修复他们的基本垃圾。他们的编译器和驱动程序都有错误,为什么要花一分钟在上面构建任何东西,直到这些东西被解决。

这看起来像是测试方法的问题。Fuzzers会抓住这些问题。在基本面良好之前投资于更高水平的垃圾产品是一种浪费。

然后向其中 另一条推文:

如果AMD公开他们的固件,我会修复他们的LLVM溢出漏洞,并为HSA编写一个模糊程序。否则,在一个你不拥有的平台上花费大量精力修复漏洞是不值得的。

具体地说,他们追求的固件目前至少是用于GPU的Micro Engine Scheduler“MES”的MES固件。

丽莎 回应:

“感谢您的合作和反馈。我们都在为您提供一个好的解决方案。团队正在处理中。”

我们将拭目以待,很明显,Tiny Corp和AMD之间的电话会议将于今天举行。如果AMD最终将其MES固件开源,或者有一些临时解决方案,那将是一件有趣的事情。由于法律/代码审查,这不太可能是一个快速的过程,更不可能他们会开放大量的固件。但由于客户的需求,他们一直致力于开发更多的开源固件,例如Sound Open Firmware Support,这是在CPU方面有趣的OpenSIL努力,去年确实做到了将他们的SEV固件作为开源发布. Stay tuned.

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论