“零一万物” 回应 Yi 开源大模型“套壳” Llama

2023年 11月 16日 27.3k 0

李开复旗下 AI 公司“零一万物” (01.AI) 上周宣布推出 Yi-34B 和 Yi-6B 两个开源大模型。其公布的基准测试结果显示虽然模型参数少于其它大模型,但性能更出色。零一万物的估值高达 10 亿美元,已跻身独角兽行列。

Yi 正式开源数日后,在其 Hugging Face 主页的讨论区中,有人指出 Yi-34B 完全使用了 Meta 开源大模型 Llama 的架构,最明显的变化只是修改了张量 (Tensor) 名称。

来源:https://huggingface.co/01-ai/Yi-34B/discussions/11

根据公开的信息,Yi 系列开源大模型没有在开源 License 中提及 Llama。上面的帖子内容经过广泛传播后,零一万物的 Yi 系列大模型被质疑是 Llama 的套壳。

昨天,“零一万物” 正式公开回应了此事。根据该公司开源团队总监 Richard Lin 的跟帖回复,他们承认了修改 Llama 张量名称的做法不妥,并会按照建议进行修改。

Richard Lin 称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。

与此同时,Richard Lin 邀请这名指出问题的开发者提交包含上述改动的 PR——对 Yi 的张量名称进行重命名以符合 Llama 架构。

最后,Richard Lin 表示团队会增强对流程的执行,避免此类错误再次发生,他们也将再次检查所有代码,确保其他一切正常。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论