面壁智能发布 Eurux8x22B 开源大模型 —— 堪称「理科状元」

2024年 5月 6日 89.4k 0

面壁智能近日发布开源大模型 Eurux-8x22B,包括Eurux-8x22B-NCA 与Eurux-8x22B-KTO,主打推理能力。

官方介绍道:

相比口碑之作 Llama3-70B,Eurux-8x22B 发布时间更早,综合性能相当,尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。

Eurux-8x22B 在 LeetCode(180 道 LeetCode 编程真题)与 TheoremQA 测试上超越了 Llama3-70B,在 LeetCode 测试上超越闭源的 GPT-3.5-Turbo。

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」-1

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」-1

据介绍,Eurux-8x22B 模型激活参数 39B,支持 64k 上下文,是由 Mixtral-8x22B 模型对齐而来,在 UltraInteract 对齐数据集上训练而成。

Eurux-8x22B模型+对齐数据集均已开源:

  • Eurux-8x22B模型GitHub地址:https://github.com/OpenBMB/Eurus
  • Eurux-8x22B模型HuggingFace地址:https://huggingface.co/openbmb/Eurux-8x22b-nca

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论