开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISCV漏洞；国内的开源模型一直很行-每日运维

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。

# 2024.6.7

今日要闻

阿里通义千问 Qwen2 大模型开源发布

6月7日凌晨，阿里云更新技术博客：重磅发布全球性能最强的开源模型——Qwen2-72B，据称性能超过美国最强的开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。亮点如下：

- 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B；
- 在中文英语的基础上，训练数据中增加了27种语言相关的高质量数据；
- 多个评测基准上的领先表现；
- 代码和数学能力显著提升；
- 增大了上下文长度支持，最高达到128K tokens（Qwen2-72B-Instruct）。

SJTUG（上海交通大学Linux用户组）下架 Docker Hub 镜像

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISC-V漏洞；国内的开源模型一直很行-1

Kubernetes 十周年

Kubernetes 的历史始于 2014 年 6 月 6 日的那次历史性提交，随后是 Google 工程师 Eric Brewer 在 2014 年 DockerCon 的 6 月 10 日主题演讲中宣布该项目（以及相应的 Google 博客）。

在接下来的一年里，主要来自 Google 和红帽的小型贡献者社区努力工作，最终在 2015 年 7 月 21 日发布了 1.0 版本。与 1.0 版同时，Google 宣布 Kubernetes 将捐赠给 Linux 基金会的一个新分支 —— 云原生计算基金会（CNCF）。

尽管达到了 1.0 版本，Kubernetes 项目仍然非常难以使用和理解。Kubernetes 贡献者 Kelsey Hightower 特别注意到了项目的易用性不足，并在 2016 年 7 月 7 日推送了他的著名“Kubernetes the Hard Way”指南的第一个提交。

自最初 1.0 版本发布以来，项目发生了巨大变化；经历了一系列重大胜利，例如自定义资源定义（CRD）在 1.16 中进入 GA 阶段，或在 1.23 中推出完全双栈支持，以及社区从 1.22 中移除广泛使用的 Beta API 或 Dockershim 的弃用中学到的“教训”。

西工大在 RISC-V 设计中发现可远程利用的中危漏洞

西北工业大学（简称“西工大”）近日发布新闻稿，称该校网络空间安全学院胡伟教授团队在 RISC-V SonicBOOM 处理器设计中挖掘出中危漏洞。据了解，该团队的研究人员在开源处理器架构 RISC-V 设计中发现了一个可远程利用的中危漏洞。它在 4 月 24 日报告给了国家计算机网络应急技术处理协调中心(CNCERT)，5 月 24 日公开了更多细节。

西工大官方新闻稿称，这是国内首个自主挖掘的 RISC-V 处理器设计上可远程利用的中危漏洞，也是国内首个处理器硬件安全领域国家重点研发计划项目 —— 纳米级芯片硬件综合安全评估关键技术研究的重要进展。

今日观察

社交观察

AI的未来在哪里？

AI的未来在哪里？或者说，如何避开和chatgpt为首的基座大模型正面竞争？

RAG不是。RAG是最容易上手的方向，本地知识库没什么门槛，应用场景也很浅。RAG的地位类似于web1.0的cms一样，是个LLM工程师就得会的基本功。

AI agent是。function call是个好东西，多模交互是个好东西，ReAct更是个好东西。有了它们就有了贾维思的条件，连上硬件更可以得到幻视！问题的关键是，如果chatgpt这种基座大模型公司自己下场做agent呢？注意，chatgpt有最聪明的LLM，通过gpts它还有最全的tools，gpt4-o证明它还有最强的多模交互。做通用型的agent就像做通用大模型一样，一定干不过chatgpt这种公司。

- 微博真阿当

国内的开源模型就是一直很行，国际上口碑也不错

在通用大模型里，国内发布的开源大模型也一直算是开源模型里第一梯队的。

比较有名的是Qwen系列大模型，Qwen的技术团队从去年夏天到现在一直在持续参与更新。系列模型里即有适合个人折腾玩的模型，也有超过千亿参数的大模型。去年发布的Qwen-72B口碑炸裂（产品发布的推文两千多赞），今年又连续推出了1.5版本的升级版，特别是还有110B这个参数过千亿的版本，吊打Llama2，口碑和Mistral的MoE模型差不多。

- 微博蚁工厂

通义千问2的700亿参数版本果然好用

我也手动测试了几个之前的bad case，结果都是对的（见图2和图3）。。提升巨大，我们现在用大模型处理数据的场景还是蛮多的，比如要标注笔记的正负面，标注对话数据的甲乙方，标注文章里面提到的品牌名称，地名等等。现在开源的大模型真是福音，方便我们这种有大量数据处理业务的企业了。

又安排员工把之前发现的其他大模型跑数据遇到的bad case都跑一遍，发现这一版通义千问在其他大模型跑出的bad case里面的表现正确率超过了75.2% （当然也有一些是错的，见图4）。其他大模型跑通过的case里面正确率达到99%。因为我们是有正确答案的，比较好统计，其实我可以给各家大模型在数据标注方面做测评啊，是不是又一个发财的机会啊。。

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISC-V漏洞；国内的开源模型一直很行-3

- 微博梁斌penny

AI会怎么写今年高考作文

分享一下让AI写高考作文的Prompt技巧吧，希望对你用大模型写其他文章也有帮助。
1. 先给他评分标准，告诉AI什么样的作文能得高分。（这里从网上搜一下高考作文评分标准，拷贝到你的提示词里）
2. 不要让AI直接写，先让他根据上面的提示词和作文要求，写出AI的写作思路，每一段怎么写，以及具体有哪些技巧可以。
3. 让AI根据写作思路来生成作文正文。
4. （可选项）让AI检查下自己的作文，是否符合上面的评分标准，列出可以改进的地方
5. （可选项）让AI根据检查的结果，修改作文，生成最终的作文稿。

- 微博蚁工厂

今年信息最给力的paper——DeepSeekV2

【大模型扩吞吐】#CacheKV压缩又添一员，MLA（Multi-head Latent Attention），低秩KV压缩；

1. 动机：压缩CacheKV的好处：①Cache小了就可加速MHA计算 ②memory省下来了可以加大batch增吞吐；

2. 标准CacheKV的大小：每个k和v的大小都是${n_h * d_h * t}，即head头数(如8) * k和v的特征维数(如1024) * 序列长度;

- 微博 Rachel____Zhang

自己写的921芯级回收和载人登月器的着陆算法

全部都是KSP-RSS/RO仿真模拟条件下，燃料效率优先的算法。（非常屎山）

这是最基本的代码，有理由相信SpaceX其实在着陆船着陆的那部分使用了G-Flop算法（开源，网上有）。而猎鹰9和Ss/Sh星舰系统使用的更多依赖发射前模拟，把数据和坐标三维信息Mapping到控制器里的方式来控制火箭的，而不是飞行器实时根据自身状态计算的。（当然可能最后驳船着陆有可能有一部分G-Flop算法）

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISC-V漏洞；国内的开源模型一直很行-4

- 微博赵若泓rhZhao

你应该问HR什么问题

我觉得你至少要问四个问题。

第一：我们公司过去一两年晋升或者加薪的员工，都是因为什么原因晋升或者加薪的？
第二：咱们公司鼓励跨部门合作吗？有多少跨部门合作？
第三个问题：咱们公司员工平均年龄多少？
第四个问题：咱们公司过去一两年离职的人，他们平均在公司任期多长？

- 微博思维螺旋

一次不成功的 pull request

昨天，我向 pgvector 提交的一个降维算法被拒绝了 Submit a simple vector dimensionality reduction function 。这个结果对我来说，并不意外。顶多算是略有遗憾。我习惯使用ollama ，而ollama的embedding接口返回的是4096维度，远大于PGVector索引支持的最大维度2000。

关于这个问题，我第一个想法是修改PGVector的维度限制，不过这个issue很快被拒绝了 Increased max dimensions for index from 2000 to 4096 。原因也很简单，PGVector这个限制其实来自PostgreSQL，PG的索引页最大为8K，所以PGVector的索引维度最大不能超过2000。在此之后，我就开始尝试实现一个实用的降维算法。一般来说，PCA（主成分分析）总是被首先推荐的，这玩意儿甚至是花书的一个重要示例。

- 挖坑不填兽

媒体观察

全球最强开源模型Qwen2发布，阿里云为开闭源之争画下休止符

阿里云在1个月前刚刚发布中文场景性能超过GPT-4的闭源模型——通义千问2.5，从这个角度来看开闭源的路线选择，阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新，又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略，使得阿里云能够在技术创新和商业化应用中取得平衡，实现技术价值的最大化。

所以，开源与闭源并不矛盾，而是在不同的场景和需求下扮演着各自独特的角色，这并不是一道非此即彼的选择题，也是时候为两者的路线之争画下休止符了。

- 品玩

面向更大市场，重视合规发展，中国AI大模型正加速“出海”

2023年，知名人工智能模型中15个在中国。截至今年3月份，中国10亿参数规模以上的大模型数量已超100个，行业大模型深度赋能电子信息、医疗、交通等领域。得益于中国大模型市场的快速发展，AI出海的趋势愈发明显。无论是大厂还是初创企业，纷纷把目光投向海外。

- 环球时报

英伟达盘中“闪崩”近6%！美国监管机构将展开反垄断调查，耶伦发出AI“重大风险”警告

耶伦在演讲中透露，人工智能与金融稳定是拜登政府高度重视的话题，“在未来几年只会变得更加重要”。金融公司使用人工智能带来的“巨大机遇和重大风险”已成为美国财政部和金融稳定监督委员会的首要议题。

- 每日经济新闻

智能经济未来可期

攻克关键核心技术。应用算法、智能芯片、开源框架……人工智能关键核心技术是行业发展的重中之重。国家发展改革委经济运行调节局局长黄勇建议，要加快建立关键共性技术攻关体系，打造国有企业、民营企业、高校及科研院所等广泛参与的产学研用创新联合体，着力实现算力芯片、高带宽内存等关键元器件的突破，加快突破人工智能关键核心技术。

- 人民日报海外版

AI 时代，苹果真的落后了？

人们似乎已习惯了苹果引领着行业，对苹果跟风别人嗤之以鼻。因此，相同的功能，苹果做得比其它公司更强，理所应当；在无人区里，苹果点燃了一盏不熄灭的油灯，才是大众所期待的结果。

若是从苹果的角度来说，iPhone 的销售额仍然占据苹果公司的 50% 以上，拿走了全球智能手机利润都 85%。苹果比任何人都希望 AI 上机后，能帮助 iPhone 卖得更好。尤其是在 Apple Car 项目取消，Vision Pro 失利的前提之下。

- 品玩

硬件软件背道而驰，港股当前的主线逻辑是什么？

交银国际发表报告指出，今年人工智能（AI）基础设施建设或将进一步加速，并建议投资者关注芯片在计算、存储和通信以及数据中心服务器等机会。该行认为，今年上半年市场表现符合预期，展望人工智能基础设施的旺盛需求或在下半年继续，而半导体或持续分化。

- 港股研究社

为什么说国产大模型的野心，都藏在 MaaS 的生态中

如果说，过去是单一算法找场景，拿着锤子找钉子，算法无法解决整体问题，导致除了人脸识别、自动驾驶外，明星场景寥寥。

MaaS 则意味着，在承认企业的需求不同、数字化能力不同的基础上，通过大模型的通用性以及生态优势，来解决这千变万化需求。

一定程度上，这是场技术你追我赶的闪电战，更是场生态与商业的持久战。

- 极客公园

黄仁勋深度访谈：十年时间，我是怎么带领 2.8 万人超越苹果的？

前不久，黄仁勋与美国移动支付巨头 Stripe CEO 帕特里克·克里森（Patrick Collison）进行了一场企业家之间的深度对谈，不仅畅聊自己曲折的成长史、与 AMD 董事长兼 CEO 苏姿丰的亲戚关系，而且点名夸奖 Llama 系列模型的重大意义和自己日常爱用的 AI 工具。黄仁勋还大谈管理经验，包括 60 位高管如何向他汇报、怎么安排日常工作、为何坚持不裁员，以及大家最关心的——这位兼具工作狂魔与魅力型领导者特质的创业者，当初如何做出卓有远见的判断，带领英伟达 2.8 万人走向伟大的成功？

- 芯东西

被扒用OpenAI牟私利， Altman到底在下哪一盘棋？

有没有一种可能，OpenAI的CEO才是Altman的“副业”，而投资则是他的主业。

从这个角度思考，Sam Altman何尝不是用一笔笔投资，建立一个未来的AI帝国。

- 36氪

今日推荐

开源项目

cyberbotics/webots

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISC-V漏洞；国内的开源模型一直很行-5

https://github.com/cyberbotics/webots

Webots 是用于模拟机器人的开放源代码和多平台桌面应用程序。它提供了一个完整的开发环境来对机器人进行建模，编程和仿真。

每日一博

万字长文详解降本增效利器 PikiwiDB (Pika) 混合存储原理

在大型键值（kv）存储系统中，用户访问的数据通常呈现明显的冷热分布特性。所谓热数据，即那些被频繁访问的数据；而冷数据则相反，它们被访问的频率极低。为了提高数据访问的效率，降低读取耗时，关键在于如何让热数据更多地驻留在内存层，减少不必要的磁盘 I/O 操作。

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISC-V漏洞；国内的开源模型一直很行-6

开源之声

用户观点

被美国列入制裁“实体清单”的西工大——在开源处理器架构RISC-V中发现可远程利用的中危漏洞

观点 1：这个漏洞怕不是故意留的吧！！！

观点 2：你去kimi 问问龙芯有过安全漏洞没有。堵上就好。谁能保证设计的处理器不经大量使用验证天生是安全的。

观点 3：普及下，我们用的是一套架构规范，这种架构规范全世界也在使用。架构规范的意思人家提出来了一套方案，具体实现你自己来做。任何方案都是有漏洞的，包括英特尔，amd 他们的芯片架构都有。唯一避免漏洞的办法就是彻底不再使用电脑。千万不要阴谋论啊。

观点 4：这就是开源的好处

观点 5：这玩意好像还没有流片。

观点 6：换道超车，不是弯道

阿里云发布全球最强开源LLM“Qwen2”：性能超越众多闭源模型、火速登顶HuggingFace

观点 1：这个和那个前几天刚发布的glm4哪个好啊

观点 2：国内一概不用，全是阉割的，我用rwkv

观点 3：RWKV也是中国团队搞的。。

观点 4：以后应该加入普通人的测试体验，现在的榜单，好像不太真实

观点 5：我都不敢想这后面的算法工程师一个月能挣多少钱

观点 6：和GPT4哪个好

观点 7：专业性强的问题，这两货都会瞎扯鸡爹蛋。但GPt在英文语料上有更好的答案，因为专业问题，很多只有英文社区才有答案

观点 8：手机跑不了一点

观点 9：为啥要手机看能跑？手机是天吗？顶天万把元的消费级玩具而已。

Java Solon v2.8.3 发布（打破 Java 资源浪费的传统印象）

观点:1：开放原子开源基金会孵化了，赞

观点 2：同时有开源版和收费版的一般开源版就是被放弃的命

观点 3：mysql 好像一直就是社区版 + 企业版。

观点 4：你为何如此高产(」゜ロ゜)」

---END---

最后，欢迎扫码下载「开源中国 APP」，阅读海量技术报告、程序员极客分享！

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISC-V漏洞；国内的开源模型一直很行-7

开源日报 | Qwen2开源；SJTUG下架Docker Hub镜像；Kubernetes十周年；西工大发现RISCV漏洞；国内的开源模型一直很行