李开复旗下 AI 公司“零一万物” (01.AI) 上周宣布推出 Yi-34B 和 Yi-6B 两个开源大模型。其公布的基准测试结果显示虽然模型参数少于其它大模型,但性能更出色。零一万物的估值高达 10 亿美元,已跻身独角兽行列。
Yi 正式开源数日后,在其 Hugging Face 主页的讨论区中,有人指出 Yi-34B 完全使用了 Meta 开源大模型 Llama 的架构,最明显的变化只是修改了张量 (Tensor) 名称。
来源:https://huggingface.co/01-ai/Yi-34B/discussions/11
根据公开的信息,Yi 系列开源大模型没有在开源 License 中提及 Llama。上面的帖子内容经过广泛传播后,零一万物的 Yi 系列大模型被质疑是 Llama 的套壳。
昨天,“零一万物” 正式公开回应了此事。根据该公司开源团队总监 Richard Lin 的跟帖回复,他们承认了修改 Llama 张量名称的做法不妥,并会按照建议进行修改。
Richard Lin 称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。
与此同时,Richard Lin 邀请这名指出问题的开发者提交包含上述改动的 PR——对 Yi 的张量名称进行重命名以符合 Llama 架构。
最后,Richard Lin 表示团队会增强对流程的执行,避免此类错误再次发生,他们也将再次检查所有代码,确保其他一切正常。