Tiny Corp的George Hotz正在开发Tinygrad和TinyBox,以获得开源人工智能领域的有趣开发,他之前因ROCM问题呼吁AMD.昨天,“小公司”发布了新的推文,内容是人工智能培训运行因MES错误而崩溃,然后呼吁AMD开源AMD首席执行官Lisa Su回应的固件。
小公司在推特上在这些问题上:
目前,我对7900XTX平台的出货不太满意。我们该怎么办?
...
我们不是AMD的QA团队,我们与他们没有任何关系。去年我看到了一些东西,给了我希望,但这个平台已经推出14个月了,仍然存在严重的问题。MES不是开源的,这让我很不安。虽然比NVIDIA更多的东西是开源的,但如果有斑点,我们就不是硬件的主人,我不觉得把时间花在这上面很好。
今天的编译器错误是锦上添花。起初,我以为这是`Launch_bunds`功能,但看起来没有该功能也可以触发。不能信任编译器会破坏对整个平台的太多信任。
这可能会让我们倒退,但也许我们应该改用3090年代或@intel
图形处理器。无论哪种方式,在这一点解决之前,我们都不会发货(或订购大宗7900XTX)。
...
我相信@AMD也不想要这些错误,但他们关注的地方错了。他们应该立即停止开发高端ML库,并修复他们的基本垃圾。他们的编译器和驱动程序都有错误,为什么要花一分钟在上面构建任何东西,直到这些东西被解决。
这看起来像是测试方法的问题。Fuzzers会抓住这些问题。在基本面良好之前投资于更高水平的垃圾产品是一种浪费。
然后向其中 另一条推文:
如果AMD公开他们的固件,我会修复他们的LLVM溢出漏洞,并为HSA编写一个模糊程序。否则,在一个你不拥有的平台上花费大量精力修复漏洞是不值得的。
具体地说,他们追求的固件目前至少是用于GPU的Micro Engine Scheduler“MES”的MES固件。
丽莎 回应:
“感谢您的合作和反馈。我们都在为您提供一个好的解决方案。团队正在处理中。”
我们将拭目以待,很明显,Tiny Corp和AMD之间的电话会议将于今天举行。如果AMD最终将其MES固件开源,或者有一些临时解决方案,那将是一件有趣的事情。由于法律/代码审查,这不太可能是一个快速的过程,更不可能他们会开放大量的固件。但由于客户的需求,他们一直致力于开发更多的开源固件,例如Sound Open Firmware Support,这是在CPU方面有趣的OpenSIL努力,去年确实做到了将他们的SEV固件作为开源发布. Stay tuned.