欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.6.4
今日要闻
DuckDB 1.0.0 版本正式发布,开启数据分析新纪元
2024 年 6 月 3 日,备受瞩目的数据分析引擎 DuckDB 迎来了一个重要的里程碑 ——1.0.0 版本正式发布。这个版本的代号为 "Snow Duck"(雪鸭),寓意着 DuckDB 在数据分析领域已经达到了一个新的高度,同时也象征着 DuckDB 团队对系统稳定性的不懈追求。
DuckDB 项目始于 2018 年,经过近 6 年的不断打磨,如今已发展成为一个拥有 30 多万行 C++ 引擎代码、4.2 万次代码提交、解决了 4000 个问题的成熟开源项目。DuckDB 以其卓越的查询性能和易用性在业界赢得了广泛赞誉,GitHub 和社交媒体平台上的关注者数以万计,每月下载量高达数百万次,仅扩展模块的下载流量就超过了每天 4TB。现在,就连维基百科也开始认可 DuckDB 的地位。
Linux Mint 默认禁用未经验证的 Flatpak 软件包
Linux Mint 项目宣布默认禁用未经验证的 Flatpak 包。启用后软件管理器会显示警告信息,让用户知道使用未经验证软件包的安全风险。如果用户允许未经验证的 Flatpak 软件包,它的软件管理器会将这些软件包清晰标记出来。
SerenityOS 作者卸任 BDFL,分叉 Ladybird
Andreas Kling 宣布卸任 SerenityOS BDFL 职务,同时分叉 Ladybird 项目。他解释称,此举并无任何其他隐情,单纯只是因为他觉得两个项目都需要独立的发展空间。
SerenityOS 是一个用于 x86 计算机的图形化的类 Unix 操作系统,由 Andreas Kling 在 2018 年创建。Ladybird 则诞生于 2022 年,最初是作为 SerenityOS 系统的 “LibWeb” 浏览器引擎调试工具开发;经过不断地完善之后,逐渐发展成了一个跨平台的 Web 浏览器。
澜舟科技开源轻量化Mengzi3
澜舟科技开源一款轻量化大模型——Mengzi3-8B,支持免费商用。今年3月底,该公司刚开源了 Mengzi3-13B 大模型。
据了解,Mengzi3-8B 是一款高效、低显存需求的AI大模型,半精度下显存占用小于16G,适用于PC(如MacBook)和大部分消费级显卡(如RTX 4090、RTX 4080、RTX 4070Ti)。
此外,Mengzi3-8 在中文能力、英语、世界知识(MMLU)、编程及数学等多个领域的知识处理和问题解决能力中,显著超越同尺寸开源模型。
抱抱脸地址:https://huggingface.co/Langboat/Mengzi3-8B-Base
今日观察
社交观察
相比于3月份的GTC大会,老黄在COMPUTEX的演讲更加放松
他在会议中特意提到夜市和一家水果摊,虽然只是卖水果,但每年都有创新(类似潮汕的甘草水果)。这些童年文化对老黄影响深远,即便现在英伟达市值巨大,依然保持在硬件和软件上的不断创新,挖掘出一道又一道的护城河。
这次会议点名了不少台湾厂商,尤其是鸿海,用英伟达的AI来生成英伟达的芯片,挺有趣的自循环。另外,自从2010年前与苹果因小事交恶后,苹果再也不用英伟达的产品,包括服务器,这也导致苹果在AI浪潮中落伍。然而英伟达却演示了Vision Pro在Omniverse中的虚拟现实应用场景,并直接提到苹果,显得大气许多。这两家公司的市值,也许在未来10天的全球市值榜上就会交换了……
- 微博 明风
电脑死机
电脑死机。
by Tatsuya Tanaka
- 微信 字体设计
操作系统是应用生态的基础
1、操作系统是应用生态的基础,Android、ios、Windows都代表的是一种生态,生态代表一种活动,在哪个生态下,你做事的方式、赚钱的手段是不同的;
2、操作系统的内核,虽然有国内的笨蛋强调RTOS(代表微内核)、Linux(代码宏内核)的差异,但在Linux把内核的bug修到今天这程度,内核尺寸上的差异已经没多大意义;
3、嵌入式,代表应用是与设备绑死的,硬软一体定制化程度高,而应用式Linux,强调包的分发,嵌入式上没这些
4、因为要硬软件一体化定制,才有“处方(receipe)”这种面向嵌入式Linux build的思维,PC Linux、服务器Linux不这样干。
- 微博 裴喜龙
“一生一芯”(ysyx.org)线下基地现面向全国开放报名
“一生一芯”(ysyx.org)北京、深圳、厦门三地线下基地现面向全国开放报名,计划招募 50 名同学,训练营为期 2 个月。此后视学员技术水平与项目组需求,可进一步提供实习及工作岗位。适合各年级同学,包括大四和研三等即将毕业或已毕业的同学。
- 微博 包云岗
从头开始编写你自己的x系列教程
目前有四本,分别教你从头编写一个redis、数据库、编译器解释器、node.js服务器。
不过只有第一本“Build Your Own Redis with C/C++”是完全开放的,其他三本是开放部分章节,其余部分要付费。
“选择一个工具或软件,尝试从头开始编写。“从头开始”不仅是拼凑组件,而是花时间学习其工作原理。
- 微博 蚁工厂
中国在摆脱美国芯片生产技术方面取得进展
《华尔街日报》报道称,中国正在努力结束对美国芯片生产技术的依赖。文章以最大芯片制造商之一的中芯国际举例。虽然中芯国际的制造工艺可能比台积电、三星电子等行业领导者“落后几代”,但这家中国公司正在“大力引进国产半导体制造设备”。
一位知情人士告诉《华尔街日报》,中国对美国工具的依赖越来越少。一名前台积电员工认为,通过禁令和制裁,将迫使沉睡的狮子醒来。
- 微博 俄罗斯卫星通讯社
媒体观察
Arm CEO:五年内拿下Windows PC市场超过50%的份额
英国芯片设计公司Arm CEO雷内·哈斯(Rene Haas)今日表示,该公司的目标是在五年内获得Windows PC市场超过50%的份额。此举正值微软及其硬件合作伙伴正准备推出基于Arm技术的新一批电脑。
哈斯今日在接受媒体采访时称:“我真的认为,在未来五年内,Arm在Windows PC中的市场份额可能会超过50%。”
微软已经做出了重大承诺,以确保Arm的技术作为AMD和英特尔x86技术的替代品,被消费者接受。而且,微软还开发了一套软件开发工具,以开发能在Arm芯片上运行的程序。
哈斯对此表示:“从软件的角度来看,他们(微软)已经非常、非常投入。”哈斯还称,高通已经面向消费者和企业设计了一款基于Arm技术的芯片,可运行在Windows之上,而其他厂商也将效仿。
- 新浪科技
阿里大模型的面子与里子
随着阿里云的“算力返租”浮出水面,我们似乎也能理解为何Kimi自年初大爆后便长期处于算力紧张的状态。不仅不时便有用户反映称Kimi网页版频繁崩溃,更是推出围绕“推理算力优先级”的充电商业模式。
但随着大模型落地在PMF、TPF(技术产品匹配度)、AMF(AI市场匹配度)、TC-PMF(技术成本与产品市场匹配度)等黑话中不断流转却不得其法,找不到业务场景之下,AI赛道玩家们的商业化落地还是无从谈起。
产品落地遥遥无期,同时阿里云以算力为基础的落地路径也遭遇了挑战。但自另一角度看,阿里云大包大揽AI创投的动作似乎也是在为自己留好退路。
就像曾经发力电商无果的腾讯将拍拍和易迅打包出售给“后起之秀”京东,阿里云或可将打好基础但寻不到落地路径的通义卖给“五虎”之一——如果真有那么一天的话,毕竟,阿里云也可借算力规模收确定的买路钱。
- 光子星球
昔日AI大模型明星公司,正在扎堆找“接盘侠”
冰火两重天,用来形容当前AI大模型创业的现状可谓再合适不过。一边是OpenAI、xAI等位于金字塔塔尖的玩家完成一轮又一轮融资,估值水涨船高;另一边则是塔尖以下的创业公司正在排队“求卖身”,苦苦寻找“接盘侠”。
- 证券时报
专家称半导体是AI巨头的阿喀琉斯之踵
人工智能的迅猛发展基于两个不同性质的支柱:一方面是大型语言模型的开发,另一方面是专用处理器带来的惊人计算能力。这些处理器主要由无处不在的巨头英伟达设计,并由以台积电为主的少数几家企业制造。人工智能模型和半导体需要巨额投资和尖端技术。然而,这是两个虽然合作紧密的领域,但它们需要满足的要求却截然不同。
- 参考消息
反X86和ARM垄断?很多人低估了RISC-V的颠覆性
很多人低估了RISC-V带来的产业颠覆性,仅仅把它看成是有可能发展成为和x86、ARM三足鼎立的一个指令集,于是很多芯片企业仅仅把RISC-V作为ARM的替代方案。正如练维汉所总结的,事实上,RISC-V本质上是一种开放标准,它打破了过去半个世纪“指令集属于公司私有”的格局,这将会塑造一个开源芯片创新的新世界。
- 观察者网
BAT大模型投资的疯狂:海投的阿里,激进的腾讯,焦虑的百度
资本从火热到趋冷,投资人从害怕“错过”到回归理性,元宇宙泡沫破裂的全过程还历历在目,对于大模型来说,要警惕像元宇宙那样,资本过后,只剩一地鸡毛。
而对于新技术来说,只有走通盈利模式,这场变革才有价值,才能真正赋能新质生产力。
- AI大模型工场
引领制造业转型升级的“头雁”
人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。工信部数据显示,我国人工智能领域企业已超过4500家,智能芯片、通用大模型等创新成果加速涌现,数字化车间和智能工厂加快建设。
- 经济日报
在这波AI大潮当中,戴尔究竟能够获利几何?
迄今为止,在整个生成式AI技术革命当中,大型原始设备制造商(OEM)似乎一直处于较为边缘的位置上。理由也非常简单,英伟达和AMD等GPU巨头正在直接将其计算引擎销售给大规模基础设施运营商、云服务商乃至其他头部客户。但随着第二波AI浪潮的涌来,也就是生成式AI逐渐成为主流,英伟达和AMD必然需要将更多GPU资源分配给OEM合作伙伴,在帮助他们拉高收入的同时也赚上一些利润。
- 至顶网
今日推荐
开源项目
labring/laf
https://github.com/labring/laf
laf 是开源的云开发平台,提供云函数、云数据库、云存储等开箱即用的应用资源。让开发者专注于业务开发,无需折腾服务器,快速释放创意。
每日一博
海量消息下王者荣耀在 TDMQ Pulsar 的实践
在游戏的实际运行中,大量的业务场景下存在消息数据交互,业务量有明显的波峰波谷,需要有一款消息队列中间件来承载该业务流程,实现上下游业务组件的松耦合,同时还需要具备灵活的扩展性。TDMQ Pulsar 版进入了王者荣耀团队的技术选型视野。
开源之声
用户观点
「斯坦福AI团队抄袭中国开源大模型」最新进展:创始人称已经比较确信对方是套壳
- 观点 1:国内一开源,国外就自主
- 观点 2:斯坦福:谁说我抄袭中国公司开源大模型?比尔盖茨早付了版权费!
- 观点 3:清华是这样的,只需要研究怎么做大模型就行了,我们斯坦福要考虑的事情就多了....
- 观点 4:斯坦福大学的华裔学生声明对此负责
- 观点 5:回旋镖无敌了
- 观点 6:斯坦福:叫 "面壁"智能 是吧,好,我来做你的"破壁人"
- 观点 7:为什么就偏偏抄你,怎么就没抄别人呢?你穿成这样走在街上,真的就一点责任都没有吗?必须反思。是斯坦福团队里面的中国成员干的吧,我不相信外国人能做出抄袭这种事情。
- 观点 8:说明我方领先了
- 观点 9:斯坦福除了少部分顶尖之人外,剩下大部分还是金主为多,不要当真
- 观点 10:抄袭不分国界,只要开始卷
- 观点 11:攻守易型了?
纽交所技术问题致伯克希尔(BRK.A)显示跌近100%,删库还是被黑?
- 观点 1:在做技术性调整
- 观点 2:PHP是世界上最好的语言
- 观点 3:看到钝角突然有莫名喜感
- 观点 4:是不是因为还在用cobol
- 观点 5:估计还是asynchronize
- 观点 6:把测试数据导入到生产了
人工智能时代的程序设计教学与课程设计
- 观点:1:为何不从需求侧倒着论述教学规划?需求侧包括就业/市场需求、具体的技术/知识需求(包括语言、底层原理、体系结构、框架、IDE……)、项目/开源参与/实践需求……
- 观点 2:Rust没有形成生态吗?我觉得Rust已经势不可挡了。C语言我推荐学,C++建议早日改成Rust。
- 观点 3:面对不同的领域,选用不同的语言。编程语言看起来很多,但在一个特定领域,没有什么选择。如果有很多选择的话,那只是对领域的理解还不够具体。如果没有一种语言非常适合那个领域,那就需要一种新语言了。
ToDesk 免费版新增连接次数和时长限制
- 观点:1:换就行了
- 观点 2:垃圾,我用frp内网穿透,直接远程桌面,很爽。todesk早就放弃了
- 观点 3:frp需要公网IP,且操作需要相应技能(包括且不限于排查异常),这两个条件就把大部分人挡在门外。而向日葵、todesk等在易用性方面很有优势。我们评价软件产品不能因为限制免费使用就评价其垃圾。类似于你经常免费帮助一些人解决问题,突然有一天你变更为有偿咨询或不再提供相关帮助,你曾经帮助过的人骂你垃圾,你是什么感想。
- 观点 4:现在部分使用环境可以获得公网IPv6,配合 tailscale 之类软件,直接用 windows 自带的远程桌面,体验会上升很多,通过录制视频方式的远程软件可以作为应急备用。todesk、向日葵、anydesk、rustdesk这几个流畅性todesk最好。我的体验基于免费版。
- 观点 5:我可以说对个人用户基本无影响。你一个月如果远程机器使用大于120小时,你自然会选购产品,或者自己找解决方案。todesk我是买专业版的,不贵100块。向日葵我也有买,向日葵最坑在于买了专业版就只能绑定一台电脑。而且还特别容易掉线(不是连接掉线,是客户端说我网络掉了,实际上我网络正常得很)。
- 观点 6:广告投入比研发投入还多,买了专业版还关不掉广告。
- 观点 7:这种软件,免费不长久啊,流量费太贵,一G要七八毛钱,不收费走不远
- 观点 8:下一步就是免费用户每次连接只能5分钟了,Teamviewer 就是这么一步一步来的
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!