DeepSeek-V2 登上全球开源大模型榜首

运维资讯 2024-07-20 共饮一杯手机阅读

美国时间 2024年7月16日，LMSYS 组织的大模型竞技场（Chatbot Arena）更新结果发布，DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型，登上全球开源模型榜首。

DeepSeek-V2 登上全球开源大模型榜首-每日运维

Chatbot Arena 是全球公认的权威大模型盲测平台，吸引了如 GPT-4、Claude、Llama、Gemini 等众多顶尖模型参与，更有 Yi-Large、Qwen、GLM等国内优秀模型同台竞技。测评方式采用人工盲测，评测者在不知晓模型名字和机构的情况下，让两个大模型回答同一个问题，选出更优质的回复。

DeepSeek-V2-0628 相较于 0507 开源 Chat 版本，在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。访问 platform.deepseek.com，接入最新版本 V2-0628 API。

DeepSeek-V2-0628 模型权重已经上传至：https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628

DeepSeek-V2 登上全球开源大模型榜首-每日运维