DeepSeek-V2 登上全球开源大模型榜首

2024年 7月 20日 41.2k 0

美国时间 2024年7月16日,LMSYS 组织的大模型竞技场(Chatbot Arena)更新结果发布,DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型,登上全球开源模型榜首。

DeepSeek-V2 登上全球开源大模型榜首-1

Chatbot Arena 是全球公认的权威大模型盲测平台,吸引了如 GPT-4、Claude、Llama、Gemini 等众多顶尖模型参与,更有 Yi-Large、Qwen、GLM等国内优秀模型同台竞技。测评方式采用人工盲测,评测者在不知晓模型名字和机构的情况下,让两个大模型回答同一个问题,选出更优质的回复。

DeepSeek-V2-0628 相较于 0507 开源 Chat 版本,在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。访问 platform.deepseek.com,接入最新版本 V2-0628 API。

DeepSeek-V2-0628 模型权重已经上传至:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628

DeepSeek-V2 登上全球开源大模型榜首-2

DeepSeek-V2 是幻方量化旗下组织深度求索在今年 5 月份发布的第二代开源 MoE 模型,其优势包括:参数更多、能力更强、成本更低。

DeepSeek-V2 登上全球开源大模型榜首-3

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论