阿里通义 Qwen2 成斯坦福大模型榜单最强开源模型 斯坦福大学基础模型研究中心主任Percy Liang在社交平台发布了HELM MMLU最新榜单,阿里巴巴的通义千问开源模型Qwen2-72B排名第5,仅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4,性能超越Llama3-70B模型,是排名第一的开源大模型,也是排名最高的中国大模型。 阿里通义千问 Qwen2 大模型于 6 月初宣布开源,包括了 5 个尺⼨的 运维资讯 2024-06-21 LOVEHL^ˇ^
阿里通义千问 Qwen2 大模型开源发布 阿里通义千问Qwen2 大模型现已发布,并在 Hugging Face和 ModelScope上同步开源。 https://github.com/QwenLM/Qwen https://huggingface.co/Qwen https://modelscope.cn/organization/qwen Qwen2系列模型是Qwen1.5系列模型的重大升级。包括了5个尺⼨的预训练和指令微调模型,: 运维资讯 2024-06-07 向阳逐梦
开源日报 | 开源模型行业化;国产Sora的秘密;谷歌Python基金会团队裁员;通义千问千亿参数模型开源;开源鸿蒙价值 欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.4.28 今日要点 谷歌 Python 基金会团队被裁员 Thomas Wouters 是谷歌 Python 工程师、CPython 核心开发者兼 Python 指导委员会成员,昨天晚上他在社交媒体发布动态称:包括自己在内的同事、主管均已被裁员。 综合 Thomas 本人陈述和其他网友的补充评论,谷歌解雇了内部参与 Py 运维资讯 2024-04-28 穿过生命散发芬芳
阿里巴巴开源 1100 亿参数 Qwen1.5110B 模型 阿里巴巴宣布开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B,该模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。 据介绍,Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的 Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理 运维资讯 2024-04-28 大猫