欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.7.10
今日要闻
中文大模型基准测评上半年报告:GPT-4o 排名第一、通义千问“国服最强”
中文大模型测评基准 SuperCLUE 发布 2024 上半年报告,披露针对国内外 33 个大模型的综合测评结果。
从代表通用能力的一级总分来看,OpenAI 的 GPT-4o 以 81 分高居榜首,Claude-3.5-Sonnet 与通义千问开源模型 Qwen2-72B-Instruct 并列第二,得分均为 77。
通义千问 (Qwen2-72B) 既是排名最高的中国大模型,也是全球最强的开源大模型,性能超越文心一言 4.0、讯飞星火 V4.0、Llama-3-70B 等开闭源大模型。
"Only Google Can Do"API:只能通过 *.google.com 访问、可读取系统 CPU 和内存使用情况等信息
Chrome 浏览器存在一个只对谷歌旗下网站公开的 API:
Google Chrome 允许所有 *.google.com 网站完全访问系统 / 选项卡 CPU 使用情况、GPU 使用情况和内存使用情况。
它还可以访问详细的处理器信息,并提供日志记录返回通道。
此 API 不会向其他网站公开,仅向 *.google.com 公开。
Vitest 2.0 正式发布:Vue 团队打造的下一代测试框架
7 月 8 日,由 Vue 团队打造的下一代测试框架 Vitest 正式推出 2.0 版本!Vitest 是一个原生支持 Vite 的测试框架。Vitest 以其快速、简洁的测试解决方案而爆火,只需要很少的配置即可上手。由于 Vitest 和 Vite 使用相同的配置文件,因此将 Vitest 集成到 Vue 应用中很简单。
Vitest 于 2021 年 12 月推出,至今已经过去了两年多的时间,其发展速度可谓是非常迅速,目前在 npm 下载量已经达到了每周 500w,并且还在呈现快速增长的趋势。
美国加州起草法案——既要把开源管起来,还要“一举两得”限制中国
SB-1047 法案,全称为「前沿人工智能安全创新法案(Safe and Secure Innovation for Frontier Artificial Intelligence Act)」,由加州参议员Scott Wiener在今年2月首次提出。目的是“为大规模人工智能系统的开发和部署设立严格安全标准,以确保其安全性并防止潜在重大危害。”
该法案针对超过10^26次浮点运算能力(FLOPs)和1亿美元训练成本,以及任何基于以上AI模型微调的、运算能力不少于3 倍10^25 FLOPs的智能系统。几乎把现在市面所有主流大模型囊括在内。
TIOBE 7 月榜单:Rust 即将进入 Top 10
上月还在 TIOBE 指数中排名第 17 位的 Rust,本月已经成功跃升至第 13 位,这也是 Rust 排行的历史新高。TIOBE CEO Paul Jansen 点评称,提升 4 个位置看似变化不大,但其实在过去几年中,Rust 一直属于是 "the talk of the town",在 TIOBE 指数中并没有取得多大进步。而现在,该语言终于出现了上升的趋势。
美国政府日前曾表示,出于安全考虑,建议开发者从 C/C++ 转向 Rust。现如今,Rust 社区正在不断壮大,第三方库和工具的数量持续增长。“简而言之,Rust 正在为进入 TIOBE 指数前十名做准备。”
TIOBE 7 月 TOP 20 编程语言
微软中国员工禁用 Android 手机工作:只能用 iPhone
据彭博社报道,微软向中国团队发出通知,宣布自今年 9 月起,员工在处理工作任务时,将被限定使用苹果公司的 iPhone 作为指定设备,安卓平台的智能手机将不再被允许用于工作相关的活动。这一规定将影响数百名员工,公司将为受影响的员工每人发放一部 iPhone 15。
今日观察
社交观察
C语言实现WebSocket协议
硬核网友用 C 语言从0编写了一个WebSocket服务器!他正在用 C 语言写一个浏览器游戏,WebSocket服务器是这个项目的一部分。
WebSocket 是一种实时技术,可在客户端和服务器之间通过持久的单套接字连接实现双向、全双工通信。
实现一个WebSocket服务器大致包括:
- 处理握手请求(即WebSockets中的“Web”),包括客户端握手请求、服务端握手相应和追踪客户等。
- 交换数据帧,包括读取并解密数据、消息切片等。
- 发送Pings 和 Pongs。
- 关闭连接。
该网友不久前也用C语言写了HTTP协议,感兴趣的朋友可以在他的油管频道查看更多相关内容。
视频:https://www.youtube.com/watch?v=rc_zVASAajU
代码:https://github.com/Bixkitts/relic-mercs-game
- 微博 量子位
黄仁勋谈人工智能为生命科学带来什么
黄仁勋强调了我们正处于一个计算革命的时代:"我们创造了这种叫做加速计算的东西。在此基础上,还有一个新的计算模型叫做生成式AI。它正在彻底改变一切。软件的编写方式、处理方式,我们可以编写的软件类型,以及我们首次能够解决的问题类型,都发生了彻底的革命。"
他指出,这是自他出生后的第二年IBM宣布System 360以来,这是计算机架构60年来的首次重大变革。这种变革不仅影响了计算机科学,还正在改变每个行业,为解决复杂问题提供了新的可能性。
他再次强调了,英伟达要专注于算法和计算能力,而与具有领域专业知识的公司(如Recursion)合作的重要性。这种跨行业合作模式使得各方都能发挥自己的优势,共同推动创新。
- 微博
高飞
面向高能物理的人工智能系统——“赛博士“(Dr. Sai)正式上线
面向高能物理的人工智能系统——“赛博士“(Dr. Sai)——正式上线,这是国际高能物理领域的首个大型人工智能系统,入口为https://drsai.ihep.ac.cn/。
2023年7月以来,在中国科学院高能物理研究所“从0到1”项目的支持下,计算中心和实验物理中心联手打造了"赛博士"(Dr. Sai)AI智能体,旨在使其高度智能化和自动化地完成文献调研、程序编写、事例产生、事例分析、结果解释和文章撰写等任务,将科学家从创新性要求较低的例行工作中解放出来。项目第一阶段聚焦我国首个科学装置——北京正负电子学对撞机上的北京谱仪III(BESIII)——的数据分析。
- 微博 曹俊IHEP
电脑上的Wi-Fi网卡也是一个小电脑,对隐私和安全至关重要
便宜的Wi-Fi4芯片价格甚至可以低至1美元以下,但这并不意味着它简单,相反,它就像你每天用的电脑一般复杂。里面有主cpu,实时控制”外设”,高算力dsp”外设”,以及各种MCU。
- 微博 spaceshuttle
你知道 Linux 终端为什么叫 tty 吗
- 了解电传打字机的历史,从19世纪开始,它如何演变成今日计算技术的基础。
- 探索 `tty` 命令如何显示你正在使用的终端名称,及其在现代操作系统中的应用。
- 发现Telex网络如何使电传打字机在全球范围内传送消息,并推动全球通信的进步。
- 深入电传打字机如何转变为现代计算机终端的核心技术,包括硬件模拟与软件模拟的演变。
- 微博 dingtingli
媒体观察
汽车智能化愈发复杂,基础软件开源引热议
虽然软件驱动汽车打开了增收的大门,但基于旧模式的汽车架构和供应链阻碍了进步。“每家汽车制造商都有自己的架构平台,但平台供应商平均有250到300家。”埃伦威格坦言,在许多情况下,供应商为每个电子元件创建特定的基础软件。
- 中国经济网
Claude编程支持一键共享,第一批网友已经开始晒作品了
Claude 3.5上新的“工坊模式”(Artifacts)再次更新,写完的网页应用支持一键分享了!不用自建服务器,不用部署后台程序,点一下就能自动获得链接。
而且被分享的应用还能一键导入自己的对话,分分钟魔改个新版本出来。
- 量子位
所谓AI革命,到现在为止,是能源的一场“灾难”
就在谷歌摩拳擦掌准备与OpenAI一较高下时,前几天其发布的一份报告却引来了媒体的“担忧”——谷歌最新发布的环境报告指出,自2019年以来,其温室气体总排放量增长了48%。
仅去年一年谷歌就产生了1430万吨二氧化碳,同比2022年增长13%,主要由于来自范围2的碳排放同比增长37%。
这些数据显然与谷歌“2030年实现零排放”的目标南辕北辙了,作为全球最大的互联网科技巨头之一,如此“奔放”的碳排放数据显然会为其招来各种非议。
- 虎嗅
新技术赋能千行百业(经济聚焦)
人工智能技术不断突破,在助推经济社会发展的同时,也带来深度伪造、隐私泄露、知识产权争议等诸多风险挑战。图灵奖得主、中国科学院院士姚期智认为,人工智能风险体现在网络风险延伸和扩大、没有意识到的社会风险等方面。
- 人民日报
OpenAI这个盘,阿里云们能接得住吗?
这些新老厂商们有着自己的底气。如果说发展早期,国内厂商许多“套壳”OpenAI,将技术化为己用,甚至大厂都有过这样的传闻,那么经过发展,当下国内厂商已经具备了独立自主的实力。
- 一点财经
进击的快手:从对标Sora 到大模型“全家桶” AI能更好打破内容、商业的互搏吗?
快手所搭建的大模型矩阵覆盖了从内容生成到商业化运营等方方面面。作为短视频平台的快手一方面通过AI技术,降低内容生产门槛,提高内容生产效率;另一方面,也积极地将AI技术运用于其电商业务中,帮助商家实现智能化经营,实现其商业化目标。
但在有限的注意力资源下,内容和商业之间不可避免地存在“互搏”,快手想用AI让它们“化敌为友”。
- 每日经济新闻
人形机器人,应该要“脸”吗?
显而易见,脸几乎是作为的人最重要的特征。以至于当元宇宙热潮来临,人们需要从一个世界进入一个世界时,要做的第一件事,也是给自己捏一张“脸”。但一个有意思的现象是,在人形机器人蓬勃发展的当下,这个致力于模仿人类形象的事物,却几乎从来没有被认真讨论过它的脸应该长成什么样。
人形机器人不需要脸吗?还是说当前的技术条件,这个话题还不应该被讨论?如果一定要给机器人一张脸的话,这张脸又应该怎么做?
- 产业象限
WAIC观察丨人工智能规模化边界,商业化挑战几何?
从“ChatGPT时刻”到“百模大战”,人工智能的破圈能力与商业潜力已经得到了充分的证明。而今天,业界对人工智能的讨论,也已经从简单AI的发展路径与商业模式,开始向更深层次的问题与症结进行探索。
- 21世纪经济报道
混元单日调用tokens达千亿后,腾讯大模型战略露出全貌
大模型之争,到了不只是拼技术的时刻。最新的行业风向是:谁能大范围应用落地?谁能笑到最后?谁能真正产生价值?
对大模型行业玩家的评判标准也不再只看技术。战略布局、落地进展、未来判断……成为了更被重视的维度。无论“杨植麟们”还是大厂高管,公开探讨大模型的频率越来越高,包括一直低调的腾讯。
- 量子位
“赛道”拥挤,大模型热潮正在消散?
时代热潮来得快,去得也快,如今一些大模型企业开启了“撤退行动”。在美国,Stability AI、Adept、Reka AI等“明星”企业正在寻求出售;在中国,仅有40%大模型完成了在工信部备案,其他众多模型则难觅踪影。
- 通信世界
今日推荐
开源项目
Jmysy/rudis
https://gitee.com/Jmysy/rudis
Rudis 是采用 Rust 语言开发的项目,旨在利用 Rust 语言的优势来重新实现 Redis 的核心功能,以满足用户对高性能、可靠性和安全性的需求,同时保持与 Redis API 的兼容。
每日一博
ODPS 开发大全:入门篇
本文旨在收集整理 ODPS 开发中入门及进阶级知识,尽可能涵盖大多 ODPS 开发问题,成为一本 mini 百科全书,后续也会持续更新。希望通过笔者的梳理和理解,帮助刚接触 ODPS 开发的同学快速上手。
开源之声
用户观点
微软中国员工被禁止使用Android手机工作:只能用iPhone
- 观点 1:这事在微软都吵翻了,有人买个便宜安卓当工作机的发了iPhone,有人觉得安卓不方便,花了一万多刚买了iPhone pro max当主力机的反而要自费
- 观点 2:工作机免费送,可以了。又不限制你生活手机使用。工作机软件环境有要求,再说了,员工也不多,能有什么影响,一个工作机可算不上什么抵制和制裁
- 观点 3:为什么不用微软手机呢?是因为没有么?
- 观点 4:公司为受影响的员工每人发一台iPhone15,那我还能说啥
- 观点 5:太正常了,现在ms的账户都要绑定authenticator,国内的安卓机器不用特殊手段都用不了,要么就是换iphone要么用硬件令牌
- 观点 6:啊,为什么我在oppo的软件商店能搜到并安装authenticator?
- 观点 7:包含基础gms框架的是可以用的,但网络原因,你不手动打开是接收不到验证推送的
- 观点 8:发一台苹果有这样的要求不过分,用安卓自己生活用。
- 观点 9:公司发手机这可太良心了,不像某些体制内不让你用苹果又不给发华为逼你自己花钱买,买华为的手机壳
- 观点 10:友情提示,微软是有过自己的windows系统手机的,这次算是彻底向苹果举白旗投降了吧
- 观点 11:authenticator不就是实现了一个共享key来生成动态密码的软件吗?根本不依赖GMS吧?安卓本身的安全性才是问题吧?
- 观点 12:发了那还行。全球未来信息战略明显是要绑定果子和谷歌那一套了,另一种意义上也算是针对种花家了。 巨硬知道自己在国内名声不好,直接摆烂了,活该被骂。
- 观点 13:有没有可能,我说是可能哈。国内的安卓都是阉割掉基础谷歌框架和服务的,这些装了魔改os的安卓国产机没法接收公司内部的一些验证服务推送,才被迫选择了苹果?都是成年人了,应该有能力思考下,真的是啥问题都是外面势力有意针对吗?
- 观点 14:不是哥们,微软跟谷歌什么仇什么怨非得禁用Android?(智慧的眼神.jpg)
- 观点 15:没GMS是借口,本质还是不想适配国内的手机系统,等鸿蒙Next出来,看微软拥抱不拥抱就知道了
- 观点 16:就是个简单的经济问题,受影响的只有几百个员工,为这几百个员工,在国内各个平台长期维护一套应用的成本,要远高于直接给这些人配一台新手机。
美国加州起草法案——既要把开源管起来,还要“一举两得”限制中国
- 观点 1:哈哈哈,我倒是想看看通过了会怎么样,企业屏蔽加州IP吗
- 观点 2:这个话题,我认为是有前车之鉴可以遵循的。就是电脑病毒和杀毒软件。法律以非常粗略的框架说明了什么该做什么不该做。由杀毒软件公司生产的杀毒软件作为执法者,在技术层面与电脑病毒对抗,保护用户。这样避免了在法律层面引入太多技术概念,又在经济层面创造了价值,使安全成为有利可图的领域。 恶意不会消亡的,法律无法控制思想和不遵守法律的人。应该鼓励一些人去在安全领域获得收益,对冲恶意的成本。
- 观点 3:果然是SB法案
- 观点 4:该法案表达的思想遥遥领先,能通过该多好啊
- 观点 5:开源精神呢
- 观点 6:因为 OSI 还没有发布正式的开源大模型定义,所以实际大模型领域还没有法律意义上的“开源”概念,也就没法复用之前对开源软件的保护法条、判例。中国开源年会的主办方开源社作为中国大陆首个 OSI 成员协会,已经提交了中国在开源大模型领域的修订意见,相信很快正式版本就会发布。
- 观点 7:对程序员是利好
去哪儿正式推行“3+2”混合办公模式,员工每周有2天可自主选择办公地点
- 观点 1:每周有四天要考虑“去哪儿”。将旅行办公模式发扬光大
- 观点 2:我要做一款app,去哪儿办公
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!