李开复旗下 AI 公司发布 Yi 系列开源大模型,估值超 10 亿美元

2023年 11月 7日 53.8k 0

创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”。根据 36 氪的独家报道,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超 10 亿美元,跻身独角兽行列。

该公司已推出 Yi-34B 和 Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。

Hugging Face:
[1]https://huggingface.co/01-ai/Yi-34B
[2]https://huggingface.co/01-ai/Yi-6B

ModelScope:
[1]https://www.modelscope.cn/models/01ai/Yi-34B/summary
[2]https://www.modelscope.cn/models/01ai/Yi-6B/summary

GitHub:
https://github.com/01-ai/Yi

据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。其中Yi-34B在Hugging Face英文测试榜单中位列第一,在C-Eval中文能力排行榜中超越所有开源模型。


Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜,Yi-34B高居榜首(2023 年 11 月 5 日)


C-Eval 排行榜:公开访问的模型,Yi-34B 全球第一(2023 年 11 月 5 日)

Yi-34B和Yi-6B的表现:

  • C-Eval中文能力排行榜:Yi-34B在C-Eval中文能力排行榜上超越了所有开源模型,这意味着在中文语言理解和生成方面,Yi-34B的性能优于其他所有开源的大模型。
  • 中文综合能力:在CMMLU、E-Eval、Gaokao等中文评测指标上,Yi-34B明显领先于GPT-4,展现了其在中文语境下的强大理解和应用能力。
  • 中文问答能力:在BooIQ、OBQA两个中文问答指标上,Yi-6B和Yi-34B与GPT-4的表现水平相当,这表明它们在理解中文问题和提供准确答案方面具有很高的能力。
  • 超长文本处理:200K上下文窗口,Yi-34B能够处理大约40万汉字的超长文本输入,这在处理长篇中文文档、书籍或报告时尤为重要,能够理解和生成连贯、准确的中文文本。
  • 技术创新:零一万物自研规模化训练实验平台和智能数据处理管线。强大的AI基础设施支持,提高了训练效率和降低了成本。

“零一万物”在官网写道,他们深信“以大语言模型为突破的 AI 2.0 正在掀起技术、平台到应用多个层面的革命”。根据他们的判断,AI 2.0 时代将诞生“比移动互联网大十倍的平台机会”,将把既有的软件、使用界面和应用重写一次,改写用户的交互和入口。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论