欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.7.29
今日要闻
OpenAI 可能在 12 个月内破产
- OpenAI 正处于破产边缘,预计亏损达 50 亿美元。
- 这家初创公司在训练其 AI 模型上花费 70 亿美元,以及在人员配备上花费 15 亿美元。
- ChatGPT 开发商获得的大约 35 亿美元的收入并不能满足其运营成本。
开源监控-夜莺项目 v7 正式发版了
关于 CrowdStrike 事故的技术报告和分析
针对近期有 “史上最严重 IT 事故” 之称的 Windows 全球大面积蓝屏死机问题,两个直接当事方 —— 微软和 CrowdStrike 均已发布了相关技术报告。
7 月 24 日,CrowdStrike 发布 Windows 大范围蓝屏事件初步审查报告,并表示即将在公开发布的根本原因分析中详细说明全面调查结果。根据报告,蓝屏死机是由内存安全问题引起的,CrowdStrike 的 CSagent 驱动程序发生了越界读取访问冲突。
86% 的用户因成本等原因放弃 Oracle Java
多年来 Oracle 在 Java 用户中的份额一直在下降,从 2020 年的 JDK 发行版市场的约 75% 下降到 2023 年的 42%。调查结果表明,86% 的 Oracle Java SE 用户正在或计划将其全部或部分 Java 应用程序从 Oracle 迁移出去。
今日观察
社交观察
GPU芯片和系统软件CUDA是英伟达的核心技术和护城河
GPU芯片和系统软件CUDA是英伟达的核心技术和护城河,但英伟达也开发和提供从AI平台到应用,包括大模型的相关产品和方案。
- 微博
硅谷陈源博士
开源硬件项目,重现80年代的电脑
slu4coder 在 GitHub 上发布了一个名为 Minimal-64x4-Home-Computer 的项目,希望 make 80年代家用电脑 great again。该电脑使用 61 个 74HCxx 逻辑集成电路、2 个 6C1008 SRAM 和 4 个 39SF0x0 FLASH,没有使用微控制器,采用冯诺依曼架构,具有 8 位数据总线和 16 位地址总线。它拥有 64KB RAM 和 512KB FLASH SSD,支持文件系统操作,能够输出 400x240 像素的单色 VGA 信号,并配备了 PS/2 接口、扩展槽和串行 UART 端口。CPU 时钟频率为 8MHz,性能达到 1.85Mips,处理能力是 Commodore C64 的 4 倍。
https://github.com/slu4coder/Minimal-64x4-Home-Computer
- 微博 蚁工厂
PDF转Markdown方案选型
1. document-convert(开源):[github.com/multimodal-art-projection/MAP-NEO/tree/main/Matrix/document-convert]
2. Ragflow(开源):[github.com/infiniflow/ragflow]
3. gptpdf(开源):[github.com/CosmosShadow/gptpdf]
4. 百度云Textmind(闭源):[cloud.baidu.com/product/textmind.html]
5. doc2x(闭源):[doc2x.noedgeai.com/]
6. 腾讯云文档解析(闭源):[cloud.tencent.com/document/product/1759/107504]
7. marker(开源):[github.com/VikParuchuri/marker]
8. PDF-Extract-Kit(开源):[github.com/opendatalab/PDF-Extract-Kit]
9. zerox(开源):[github.com/getomni-ai/zerox]
10. OminiParse(开源):[github.com/adithya-s-k/omniparse]
11. MinerU(开源):[github.com/opendatalab/MinerU]
- 微博 宝玉xp
本周AI行业迎来了多项重要公告和分析
4. 模型蒸馏的政策变化
Meta在Llama 3.1中放宽了关于模型蒸馏的限制,允许开发者使用Llama 3.1的输出训练较小的模型。这一政策变化可能会对AI模型开发产生深远影响,使得开发小型高效模型变得更加可行和经济。这一举措也可能促使其他公司调整其模型的使用条款,以适应市场需求。
5. 大科技公司对AI资本支出的评论
科技公司为了保持竞争力,不得不继续在AI领域投资。本周,Google CEO Sundar Pichai和Meta CEO Mark Zuckerberg发表了类似的评论。Sundar表示:“投资不足的风险远远大于过度投资的风险。”Zuckerberg则说:“我宁愿过度投资以追求成果,而不是通过缓慢开发来节省资金。”他还指出:“现在有很大可能许多公司正在过度建设,但它们都是在做出理性的决策,因为落后于最重要技术的风险将让你在未来10到15年中处于不利位置。”
- 微博 游资赵老哥v
华为鸿蒙有类 rtos,可惜在支持开源上态度有点迷
和做芯片的老板聊,其实 ai 时代比较理想的硬件方案是 :
riscv + rtos +mic,speaker,屏幕,触控,电源管理,bt/wifi 支持。挂 4g 内存,上 llm。
华为鸿蒙有类 rtos ,也有星闪芯片。是有机会的。
可惜在支持开源上态度有点迷,在吸引 riscv 和 rtos 社区开发者上面效果不好。
以至于目前星闪方案的设备非常少。。
- 微博
李楠或kkk
媒体观察
云计算市场开启新一轮增长
“云计算作为数字信息世界的关键基础底座,在推动大数据、人工智能等新一代信息技术与实体经济深度融合方面发挥着关键作用,成为产业转型升级、数字生态构建的重要抓手。”中国通信标准化协会副理事长兼秘书长代晓慧在日前召开的2024可信云大会上表示。
- 经济日报
谁会成为人形机器人第一城?
据「产业象限」不完全统计,2024年上半年,全球人形机器人领域共完成22起融资,总金额超70亿元。其中中国人形机器人领域完成融资13起,总融资金额超25亿元。
- 产业象限
平安证券:看好AI主题的投资机会 关注五个方向
看好AI主题的投资机会,建议关注五个方向:1)算力方面,关注紫光股份、拓维信息等;2)算法方面,关注科大讯飞等;3)应用场景方面,关注盛视科技等;4)网络安全方面,关注推荐启明星辰;5)医疗IT主题方面,关注卫宁健康等。
- 证券时报网
2024年,谁家还没有一台NAS啊?
有了U盘、移动硬盘、网盘云盘,你还会购买NAS来搭建属于自己的个人云,存储照片、视频、文件等个人数据吗?
对于这个问题,有些用户认为NAS是伪需求,看别人用觉得很香,自己买回来后却是闲置吃灰;有些用户则表示,NAS可以极大提升工作效率和生活体验,一旦用过就再也回不去了。
- 洞见新研社
数字经济对经济增长贡献率超六成
上半年本市产业经济回升向好态势进一步巩固增强,工业、信息软件业成为支撑全市经济增长的重点产业,增加值合计首次超过7000亿元,对经济增长贡献超六成,上拉GDP增速3.4个百分点;数字经济增加值同比增长7.8%,对经济增长的贡献率也超六成。日前,记者从市经信局获悉了如上数据。
- 北京日报
傅盛:我不看好双足机器人的商业化
今天人形机器人很火,但是我对双足机器人在商业化上的成功不是很看好,作为科研是可以,如果落地到产线上工作,没有三五年就不可能。
- 中国企业家杂志
从自研芯片到操作系统,李斌8小时详解蔚来高额研发投向何处
智驾芯片是“蔚小理”新势力攻坚的方向。一方面自研智驾芯片一定程度上减少对海外芯片大厂的单一依赖,另外能够与自研算法形成更高配合度,充分挖掘芯片算力极限。芯驰科技董事长张强,汽车公司自研自动驾驶芯片还可以给公司带来充分的品牌溢价。
- 界面新闻
多款AI游戏亮相ChinaJoy:人工智能已成为研发“标配”
此次ChinaJoy期间, 游族网络 首次公开其首款AI玩伴产品“代号小游酱”的形象。此外, 巨人网络 则展出了其《太空杀》游戏,这款游戏推出了全新的 AI玩法“AI推理小剧场”。 世纪华通 旗下的《传奇》《龙之谷》《彩虹岛》《饥荒》等知名IP产品也都接入了AI工具。
- 中国经营网
今日推荐
开源项目
emqx/nanomq
https://gitee.com/emqx/nanomq
NanoMQ MQTT Broker (NanoMQ) 是一个全方位的边缘消息传递平台,包括一个用于物联网/物联网的超快 MQTT Broker 和一个用于 SDV 的轻量级消息传递总线。
每日一博
Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析
Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发,70B 适合大规模 AI 原生应用,而 405B 则适用于合成数据、大语言模型 (LLM) 作为评判者或蒸馏。这三个规格都提供基础版和指令调优版。
类别 | 基准 | 样本数 | 指标 | Llama 3 8B | Llama 3.1 8B | Llama 3 70B | Llama 3.1 70B | Llama 3.1 405B |
综合 | MMLU | 5 | 宏观平均 / 字符准确率 | 66.7 | 66.7 | 79.5 | 79.3 | 85.2 |
MMLU PRO (CoT) | 5 | 宏观平均 / 字符准确率 | 36.2 | 37.1 | 55.0 | 53.8 | 61.6 | |
AGIEval 英语 | 3-5 | 平均 / 字符准确率 | 47.1 | 47.8 | 63.0 | 64.6 | 71.6 | |
CommonSenseQA | 7 | 字符准确率 | 72.6 | 75.0 | 83.8 | 84.1 | 85.8 | |
Winogrande | 5 | 字符准确率 | - | 60.5 | - | 83.3 | 86.7 | |
BIG-Bench Hard (CoT) | 3 | 平均 / 完全匹配 | 61.1 | 64.2 | 81.3 | 81.6 | 85.9 | |
ARC-Challenge | 25 | 字符准确率 | 79.4 | 79.7 | 93.1 | 92.9 | 96.1 | |
知识推理 | TriviaQA-Wiki | 5 | 完全匹配 | 78.5 | 77.6 | 89.7 | 89.8 | 91.8 |
SQuAD | 1 | 完全匹配 | 76.4 | 77.0 | 85.6 | 81.8 | 89.3 | |
阅读理解 | QuAC (F1) | 1 | F1 | 44.4 | 44.9 | 51.1 | 51.1 | 53.6 |
BoolQ | 0
|
字符准确率 | 75.7 | 75.0 | 79.0 | 79.4 | 80.0 | |
DROP (F1) | 3 | F1 | 58.4 | 59.5 | 79.7 | 79.6 | 84.8 |
开源之声
用户观点
闲鱼网页版已回归
- 观点 1:赞同收费,良性循环
- 观点 2:单笔最高60元,可以在闲鱼上卖房吗
- 观点 3:明明可以直接抢,他非要说这是软件服务费,他真的,我哭死
- 观点 4:它提供软件应用平台,收取用的人一定费用,这个逻辑竟然很不可思议吗?
- 观点 5:闲鱼交易量大了,我觉得应该对于二道贩子收费,普通用户一个月卖个一两个收什么服务费啊
- 观点 6:那些觉得收费不合理的,到底是受了什么样的教育才觉得别人应该免费给你白嫖?平台运行的电费国家可以给他免吗
- 观点 7:脱平台交易又要变多了
- 观点 8:当初态度强硬直接下掉网页版,把用户都赶到app端,现在又想让用户回归网页端
- 观点 9:希望能在国内各大城市开通咸鱼实体店,这样我们就可以更直观放心地交易,促进良品循环。
- 观点 10:商家太多,很难筛选出个人买家
- 观点 11:没有定位功能
- 观点 12:打击商家的吧,在淘宝有服务费咸鱼没有
- 观点 13:是用 react 写的,这我没想到
- 观点 14:闲鱼app那能用的?我都用小程序看了
Linux Mint 22“Wilma”正式发布
- 观点 1:原来以为新内核会拖慢旧电脑的运行效率,试了下也是跑得呼呼地。赞了爱了
- 观点 2:新版本支持搜狗输入法不?
- 观点 3:尝试过几次mint,结果有数的几次kernel panic都是mint贡献的
- 观点 4:mint在中国的关注度不算高,都没中文社区
- 观点 5:支持Wayland好评
- 观点 6:ubuntu总是和我的电脑有一些兼容问题
- 观点 7:任何 Linux 发行版大版本升级都是一场灾难,每次要用新版都老老实实从零装吧!别升级了。
- 观点 8:有时候一些在旧版系统用得好好的软件,新版的apt库没有
- 观点 9:界面不够现代化
Rust 1.80.0稳定版发布
- 观点 1:rust 越来越好了
- 观点 2:cargo, run!
- 观点 3:语言神,启动!
- 观点 4:各种缩写,还有鸡肋的语法
- 观点 5:我就吐槽rust的语法,感觉不把ascii符号排列组合完,就全身不舒坦。何必这么费劲啊,直接用亚洲语系不就行了,常用字就5000多啊,够你折腾了吧,还好记,真记不住,查下翻译就知道了。
- 观点 6:~目录下有.cargo目录导致的
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!