最强开源大模型 Llama 3 上架 Gitee AI

2024年 4月 19日 126.7k 0

导语:4月18日,Meta 发布两款开源 Llama 3 8B 与 Llama 3 70B 模型,供外部开发者免费使用。此次发布不仅是技术革新的展示,也是开放源代码精神的体现,预示着 AI 应用的新篇章即将开启。

此次,Meta 共开源了 Llama 3 8B 和 Llama 3 70B 两款模型,分别有预训练和指令微调两个版本。

平台链接

访问下方链接,进入平台即可体验(邀请码:llama3):

https://ai.gitee.com/hf-models/meta-llama/Meta-Llama-3-8B-Instruct

最大4000亿参数

Meta Llama 3 引入了多项技术革新,其中包括支持更长的上下文窗口、多种模型尺寸、以及提升的性能表现。此外,新模型在多个行业基准测试中表现出顶尖水平,特别是在逻辑推理和编程指令跟随方面的改进,使其在同类开源模型中独树一帜。

Llama 3的亮点和特性如下:

  • 基于超过 15T token 训练,大小相当于 Llama 2 数据集的7倍还多;

  • 训练效率比 Llama 2 高3倍;

  • 支持8K长文本,改进的 tokenizer 具有 128K token 的词汇量,可实现更好的性能;

  • 在大量重要基准测试中均具有最先进性能;

  • 增强推理和代码能力;

  • 安全性有重大突破,带有 Llama Guard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具,还能比 Llama 2 有更好“错误拒绝表现”。

可持续发展与社区参与

Meta Llama 3 不仅仅是一个技术产品,它也代表了 Meta 对于持续发展的承诺。通过将这一模型开源,Meta 希望能激发全球开发者社区的创新潜力,共同推动人工智能技术的进步。此举不仅促进了技术的普及,也确保了在开发过程中社区的反馈被充分考虑。

安全与道德的前瞻思维

在开发 Meta Llama 3 的过程中,Meta 特别重视安全性和道德责任。新引入的 Llama Guard 2 和 CyberSec Eval 2 等工具,为开发者提供了更多资源以负责任地使用和部署这些模型。这显示了 Meta 在确保 AI 安全和可靠部署方面的行业领导地位。

Meta Llama 3 的发布不仅仅是技术的进步,更是开放创新精神的体现。它不仅为开发者提供了强大的新工具,也为全球 AI 生态系统的未来发展设定了新的标准。在 AI 的浪潮中,Meta 通过 Llama 3 展示了合作与创新的力量,期待这一平台能启发出更多人工智能的创新应用。

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论