创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”。根据 36 氪的独家报道,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超 10 亿美元,跻身独角兽行列。
该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
Hugging Face:
[1]https://huggingface.co/01-ai/Yi-34B
[2]https://huggingface.co/01-ai/Yi-6BModelScope:
[1]https://www.modelscope.cn/models/01ai/Yi-34B/summary
[2]https://www.modelscope.cn/models/01ai/Yi-6B/summaryGitHub:
https://github.com/01-ai/Yi
据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。其中Yi-34B在Hugging Face英文测试榜单中位列第一,在C-Eval中文能力排行榜中超越所有开源模型。
Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023 年 11 月 5 日)
C-Eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023 年 11 月 5 日)
Yi-34B和Yi-6B的表现:
- C-Eval中文能力排行榜:Yi-34B在C-Eval中文能力排行榜上超越了所有开源模型,这意味着在中文语言理解和生成方面,Yi-34B的性能优于其他所有开源的大模型。
- 中文综合能力:在CMMLU、E-Eval、Gaokao等中文评测指标上,Yi-34B明显领先于GPT-4,展现了其在中文语境下的强大理解和应用能力。
- 中文问答能力:在BooIQ、OBQA两个中文问答指标上,Yi-6B和Yi-34B与GPT-4的表现水平相当,这表明它们在理解中文问题和提供准确答案方面具有很高的能力。
- 超长文本处理:200K上下文窗口,Yi-34B能够处理大约40万汉字的超长文本输入,这在处理长篇中文文档、书籍或报告时尤为重要,能够理解和生成连贯、准确的中文文本。
- 技术创新:零一万物自研规模化训练实验平台和智能数据处理管线。强大的AI基础设施支持,提高了训练效率和降低了成本。
“零一万物”在官网写道,他们深信“以大语言模型为突破的 AI 2.0 正在掀起技术、平台到应用多个层面的革命”。根据他们的判断,AI 2.0 时代将诞生“比移动互联网大十倍的平台机会”,将把既有的软件、使用界面和应用重写一次,改写用户的交互和入口。