欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.7.19
今日要闻
Crowdstrike 更新导致全球 Windows 大面积蓝屏死机
全球大量 Windows 用户今天在更新 CrowdStrike 后遇到了蓝屏死机 (BSOD) 错误。该问题似乎很普遍,影响运行不同 CrowdStrike 版本的机器。在社交媒体上,全球不同地区的用户纷纷在抱怨这个突如其来的蓝屏死机错误。
英伟达全面转向开源 GPU 内核模块
英伟达通过官方博客现在正式宣布,其开源内核模块最终将取代闭源驱动 —— 目前正处于完全过渡到开源 GPU 内核模块的时刻。在即将发布的 R560 驱动版本中,他们将作出这一更改。
借助 R515 驱动程序,英伟达于 2022 年 5 月发布了一套开源的 Linux GPU 内核模块,该模块采用双许可证,即 GPL 和 MIT 许可。初始版本主要面向数据中心计算 GPU,而 GeForce 和工作站 GPU 则处于 Alpha 状态。
当时,他们宣布在后续版本中将提供更可靠、功能齐全的 GeForce 和工作站 Linux 支持,NVIDIA 开放内核模块最终将取代闭源驱动。
OpenAI 发布“小”模型 GPT-4o Mini
GPT-4o mini GPT-4o mini 在 MMLU 上的得分为 82%,目前在 LMSYS 排行榜(在新窗口中打开)上的聊天偏好方面优于 GPT-4。它的价格为每百万输入代币 15 美分,每百万输出代币 60 美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。
GPT-4o mini 以其低成本和低延迟实现了广泛的任务,如连锁或并行多个模型调用(如调用多个 API)、向模型传递大量上下文(如完整代码库或对话历史)或通过快速、实时文本回复与客户交互(如客户支持聊天机器人)的应用。
目前,GPT-4o mini 的应用程序接口支持文本和视觉,未来还将支持文本、图像、视频和音频输入和输出。该模型的上下文窗口可容纳 128K 标记,每个请求最多支持 16K 输出标记,知识库可持续到 2023 年 10 月。
GPT-4o mini 现已作为文本和视觉模型提供给助手应用程序接口(Assistants API)、聊天完成应用程序接口(Chat Completions API)和批处理应用程序接口(Batch API)。在 ChatGPT 中,免费、Plus 和 Team 用户从今天开始将能访问 GPT-4o mini,以取代 GPT-3.5。
DeepSeek-V2 登上全球开源大模型榜首
美国时间 2024 年 7 月 16 日,LMSYS 组织的大模型竞技场(Chatbot Arena)更新结果发布,DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型,登上全球开源模型榜首。
DeepSeek-V2 是幻方量化旗下组织深度求索在今年 5 月份发布的第二代开源 MoE 模型,其优势包括:参数更多、能力更强、成本更低。
今日观察
社交观察
2022 年 11 月开源,我们达到一个小小的里程碑:4000 star
2022 年 11 月开源,到现在也还没满两年,我们达到一个小小的里程碑:4000 star,并且国内和海外对半开。这个过程没有什么奇技淫巧,我坚信老老实实做好产品和技术,老老实实去做好社区,这是一家以开源为本的公司的基础。让我开心的是,我们的独立贡献者有 70~80 个,大部分不是一些简单的修正(当然,我们也非常欢迎),而是深度参与了一些 feature 的研发,由衷地表示感谢。#GreptimeDB#
- 微博 zx-dennis
从一个建筑生成器变成了城市生成器
从去年开始,就看到大佬 Pavel Oliva 在推上频繁地测试自己的建筑生成器 Buildify,最近终于发布了。没想到的是,已经从一个建筑生成器变成了城市生成器,还完美兼容知名开源地理插件 Blender OSM。而更没想到的是,免费,可商用。
▶ 下载地址:https://paveloliva.gumroad.com/l/buildify
▶ 神仙作者:Pavel Oliva
- 微博 Simon_阿文
GPU,独孤求败?
据台媒报道,台积电近期准备开始生产英伟达最新Blackwell平台架构GPU,同时因英伟达的客户需求强劲,故此对台积电的晶圆订单增加25%;并有可能令本周放榜的台积电上调今年盈利预期。
报道引述业界消息指出,亚马逊、戴尔、谷歌、Meta及微软等都会使用Blackwell架构GPU来建立AI伺服器,令需求超出预期。
英伟达的利好,让大家对人工智能、GPU和AI芯片有了更多的想法,但这能继续持续吗?
- 半导体行业观察
史上最大泡沫的半导体公司
谁是全球最大泡沫的半导体公司?有人说是英伟达。
但是,英伟达的动态估值只有60倍,以它仍然无懈可击的GPU产品,以及垄断市场的地位,你很难说这个估值高得离谱,何况,AI未来是何等的星辰大海。
更重要的是,英伟达完全能够交得出业绩,90%的毛利率,50%的净利率,一年数百亿美元的净利润,距离微软的水平也不是很遥远,你可以说英伟达的估值不便宜,但说是泡沫,似乎也不妥。
如果对比另外一个半导体公司,英伟达的估值可以说低得可怜。因为那家半导体公司的动态PE,是英伟达的10倍。不到一年时间,它的市值暴涨4倍,接近2000亿美元。而一年的营收,在30亿美元的水平,净利润只有区区3亿美元,算下来,PE接近600倍。
这家公司叫ARM。
- 微信 格隆汇
DeepSeek刚刚发布了他们最新的DeepSeek-V2-0628
DeepSeek 刚刚发布了他们最新的DeepSeek-V2-0628,在huggingface已经可以下载了,但是这个非量化版本实在是太大了,达到了236B, 按照官方的说法, 需要8块80G的显卡才能跑起来. 即使是4bit量化的版本(由于刚发布3小时, 还没人去量化), 估计消费级硬件也只有192G的顶配 Apple M2 Ultra 可以试一试了. 好奇为啥不推出一款差不多70b的型号? 33b的倒是有, 但是还没更新。
- 微博 karminski-牙医
媒体观察
摩尔线程万卡GPU集群新进展!性能可提升20倍
摩尔线程官方宣布,与清华系AI系统软件公司清程极智正式建立战略合作关系,旨在加速国产大规模GPU智算集群的产业化进程,推动AI算力生态的快速发展,为大模型行业提供更强大、灵活且高效的基础设施支持。
- 快科技
中国市场手机AI用什么大模型?三星增加了字节豆包,市场还在等待苹果的答案
在一段时间的摸索和沉淀之后,各家AI手机的战略轮廓逐渐变得更加清晰,厂商们在自研大模型之外,也陆续尝试接入AI公司的通用大模型,比拼用户体验。
- 蓝鲸财经
鸿蒙生态创新中心落地武汉,将重点做这些事——
鸿蒙生态(武汉)创新中心是继深圳、成都之后,华中首个、全国第三个鸿蒙生态创新中心,是一个集技术服务、展示体验、教育培训、活动推广等功能于一体的高水平公共服务平台。
- 大武汉
4 年、230 亿美元、创谷歌收购纪录,这家公司怎么做到的?
在竞争激烈的市场中,Wiz 的卖点是「一站式平台」,提供云工作负载保护(CWPP)、云安全姿态管理(CSPM)、云基础设施权限管理(CIEM)等功能。同时,Wiz 还与许多其它初创公司合作,建立生态系统,提供灵活性。
- 极客公园
GPT-4o迷你版发布,ChatGPT杀死ChatGPT
自2023年下半年起,“落地”就成了AI圈内最常提及的话题。一个明显的趋势是,为了加快AI的落地,模型尺寸在变小,更轻量、更垂的模型不断推出,模型变得越来也便宜。
- 36氪
中国电信星辰大模型首次落地手机终端
中国电信推出首款AI手机麦芒30,搭载高通骁龙695处理器,内置中国电信自研的星辰大模型。据了解该手机可实现文案创作、图像生成、智能问答、一键调用AI等功能。
- 第一财经
突破CUDA包围圈,再出一招
为了突破CUDA护城河,现在已经有各种努力,比如 HIPIFY 帮助将 CUDA 源代码转换为适用于 AMD GPU 的可移植 C++ 代码,然后是之前由 AMD 资助的ZLUDA,允许 CUDA 二进制文件通过 CUDA 库的直接替换在 AMD GPU 上运行。
但现在又出现了一个新的竞争者:SCALE。SCALE 现已作为 GPGPU 工具链公开,允许 CUDA 程序在 AMD 图形处理器上本地运行。
- 半导体行业观察
今日推荐
开源项目
openturns/openturns
https://github.com/openturns/openturns
OpenTURNS 是一个 C++ 和 Python 库,内置专用于处理不确定性数据的模型和算法。该库的主要目标是提供处理工业应用研究中的不确定性所需的所有功能。
每日一博
如何实现埋点日志精准监控
日志中台承载了百度千亿量级 PV 的埋点流量,如何对这些流量进行准确监控,并支持个性化字段的抽取、下钻,是日志中台的一大难题。本文简单介绍了日志中台的基本概念及实时流架构,并基于此深入讲解了低成本实现可扩展、高准确度的埋点监控的技术方案。
开源之声
用户观点
Crowdstrike更新导致全球Windows大面积蓝屏死机
- 观点 1:信息安全厂商 CrowdStrike 的一款产品在更新后,众多运行 Windows 的电脑瞬间成废砖。CrowdStrike 的首席威胁猎人 Brody Nisbet 已确认了这个问题,并在 X上发布了以下内容: 存在一个有错误的通道文件,所以不是完全意义上的正确更新。有一种解决方法:1、引导Windows进入安全模式或WRE。2、进入C:\Windows\System32\drivers\CrowdStrike。3、找到并删除匹配“C-00000291*.sys”的文件。4. 正常启动。他在后来的另一个帖子中写道:“这个解决方法并不能帮助所有人,不过我目前也没有进一步可付诸实践的方法可以帮助用户。”
- 观点 2:睡醒后,全公司都蓝屏了
- 观点 3:夫妻双双把家还。干不了活,回家了
- 观点 4:刚刚经历蓝屏,公司几百台办公笔记本电脑一台接一台蓝屏。在家办公的也未能幸免。起初还以为是公司网络故障导致的。工作的激情戛然而止,公司一下子热闹起来。
- 观点 5:为了给中国的牛马休息,微软他,我哭死!
- 观点 6:哭错坟了兄弟,这不是微软的
- 观点 7:这是上公有云的优点之一
- 观点 8:网管:重启 或者换台电脑 试试!
- 观点 9:Linux用户前来吃瓜
- 观点 10:我说今儿为啥OneDrive提示“很抱歉,OneDrive 服务器出现问题 -- (错误代码: 0x8004def5)”
- 观点 11:这是另外一个问题
- 观点 12:我用MAC 别和我聊这个话题
- 观点 13:有个问题,蓝屏了,想截屏发个朋友圈该怎么截?
- 观点 14:用门锁拍,拍完记得还回去
- 观点 15:重命名一下文件就行,别忘了sudo提权
Google 搜索引擎默认不再索引新内容
- 观点 1:本身是消费端【找内容】的主场景,已经变成生产端【内容曝光】的主场景。搜索领域的“推荐算法、信息流”该革新了,不管是个性化还是非个性化方向。
- 观点 2:感觉就是从年初开始,google的搜索质量确实越来越差了,无论是中文英文
- 观点 3:翻译一下: 你们产出的垃圾内容太多了,我们的服务器不够用了
- 观点 4:不索引新内容如何发现新“独角兽”呢?这样会加强既得势者的垄断,保护了垄断者,拒绝了新创新者。
新进展!deepin M1 项目更新至 deepin V23 RC2 版本
- 观点 1:一堆bug没解决去适配mac
- 观点 2:你可以自己动手解决bug,也可以多捐钱加快bug处理速度, 不要一边吃饭一边骂厨子
- 观点 3:Fedora 适配好几年了,驱动拷过来就行了,这还值得写一下?
- 观点 4:deepin底层是ubuntu,他可适配不了centos
- 观点 5:v23 rc2是真的难用 各种bug多的要死
编程高手如何给代码“下毒”?
- 观点 1:直接代码里暗度陈仓,留点小秘密,被优化后,到黑市上以另一个身份,贩卖个好价钱,一石二鸟,既给自己创收,又让压力到了对方那边。并且这锅到时候也不用你背,顶多算bug
- 观点 2:话说,你不删都崩溃的代码,为什么要多此一举,给公司创造利益。我的意思是,删代码,公司起诉你,找你索赔这种方式创造利润。
- 观点 3:没事,正常写也是屎山,无需刻意
- 观点 4:写成废码,说得好像请你回来,你能维护一样,搞笑
- 观点 5:程序员何苦为难程序员,老板哪会关心代码怎么写的,有问题背锅的是下一个程序员,怎么实现我不管,限你今天就搞定
- 观点 6:数据清洗技术,代码质量评分,AI优先淘汰废码程序员
- 观点 7:如果AI给代码埋雷没有任何人会知道
- 观点 8:每天一条辞职小技巧
- 观点 9:打工人互害
- 观点 10:公司也学会防御性审核,一旦发现防御性代码,立即开除而且无需补偿
- 观点 11:代码进分支不会审查吗?不能随便什么代码都进
- 观点 12:情绪化严重的码农,泄愤都未必代表事情的经过他是对的,有可能是唯心主义者
- 观点 13:你这样敲码的话,有没有一种可能,没等公司把你辞退,你就率先因为看不懂自己上个月写的代码而提桶跑路了?
- 观点 14:过于愤世嫉俗了哇,人人微笑,微笑人人!
- 观点 15:连代码审核都不做的公司,跑就跑了,还弄这么多花花肠子
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!