欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.6.3
今日要点
斯坦福抄袭中国大模型
5 月 29 日,斯坦福大学的一个研究团队发布了一个名为”Llama3V”的模型,号称只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。由于该团队的作者来自斯坦福,又集齐了特斯拉、SpaceX、亚马逊与牛津大学等机构的相关背景经历,该模型迅速冲到了 Hugging Face 首页。
但没过几天,X 与 Hugging Face 上就有质疑 Llama3V 套壳面壁智能在 5 月中旬发布的 8B 多模态小模型 MiniCPM-Llama3-V 2.5的声音。对此,Llama3V 团队回复,他们”只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer”,并宣称”在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作”。
紧接着,6 月 2 日,有网友在 Llama3V 的 Github 项目下抛出事实性质疑,但很快被 Llama3V 的团队删除。为此,提出质疑的网友被激怒暴走,跑到了 MiniCPM-V 的 Github 页面进行事件还原,提醒面壁智能团队关注此事。
随后,面壁团队通过测试 ,发现 Llama3V 与 MiniCPM-Llama3-V 2.5 在”胎记“”般案例上的表现 100% 雷同,”不仅正确的地方一模一样,连错误的地方也一模一样”。
微软 Edge 市场份额创历史新高
知名流量监测机构 Statcounter 公布了 2024 年 5 月份全球桌面浏览器市场份额:
主要数据如下:
- Chrome:64.88%
- Edge:13.13%
- Safari:8.8%
- Firefox:6.64%
- Opera:3.23%
- 360 Safe:1.09%
- ……
上个月,微软 Edge 的全球桌面浏览器市场份额上升至 13.13%,创下历史新高。
微软 WSL 最新进展:即将推出 WSL 设置应用
WSL 集成将通过新的 “Environments” 功能进入 Dev Home 控制中心。用户可以在此管理、启动和创建新的开发环境,还可以在此界面上与 WSL 发行版进行交互。
首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度
港大、百度联合团队借鉴大型语言模型的思想,提出了一种新型的时空大型语言模型UbanGPT。该模型在多种城市应用场景中展现了出色的普适性。通过结合时空依赖编码器和指令微调方法,该模型增强了对时间和空间复杂关系的理解,即使在数据稀缺的条件下也能提供更精确的预测。
通过一系列广泛的实验,UrbanGPT在多个城市相关的任务上展现了其卓越的性能,并证明了其在零样本学习领域的强大潜力。
今日观察
社交观察
中国互联网软件近20年的快速发展,给我们带来了错觉
中国互联网软件近20年的快速发展给我们带来了错觉,认为企业服务软件也可以快速赶上。其实ToC和ToB内在逻辑完全不同。
各国人民消费类似,但是生产过程截然不同。一个已经脱离农业四五代人的社会的组织方式,和一个刚刚脱离农业半代人的社会组织方式,是截然不同的。
- 微博 出版人周筠
人工智能时代的程序设计教学与课程设计
摘要:随着人工智能的兴起,学生对编程的热情逐渐从C/C++向Python迁移,对于计算机硬件体系结构的理解也呈现逐年下降的趋势。当前许多人工智能从业者做的是人工智能算法设计,但参与基础人工智能软件开发的相对较少。我们认为本科生教育中应该加强基础软件开发的教学,可利用学生对人工智能的热情,培养学生开发基础底层软件平台的能力。本文作者在多年教学中,面向人工智能时代的社会需求,将一门传统的程序设计课程“C/C++程序设计”,逐年优化和改进成为一门包含多项内容的“高级计算机程序设计”课程。该课程通过引入开源项目作为案例,向学生传授C和C++的独特优势,介绍多种CPU架构、GPU编程、计算瓶颈分析、各种开发工具和新型Rust语言等内容。这些内容让学生更加深入地理解程序设计,提升了教学质量,课程受到了学生的广泛欢迎。
- 微信 于仕琪
计算机专业是一个好专业,值得选择
虽然现在很多人都说“计算机专业现在不行了”,“毕业即失业”,但我还是认为,这是一个好专业,值得选择。
不过,进来之后,得好好学。如果躺平,确实大概率会毕业即失业,因为这行现在不缺人,而且竞争激烈。
计算机专业需要很强的自学能力,并且需要终身学习,能否胜任这一挑战,可以事先作一评估。比较有效的评估方法是,自学一门编程语言,然后用它完成一个项目,之后,你就有感觉了。
对于没有编程经验的初学者,推荐从JavaScript和Python中选择一种学习。这两种编程语言,对初学者友好,学几天就可以上手编程,又都有非常活跃的生态圈,大量的可用组件,可以做非常多的事情,写出比较有趣的程序。
- 微博 软件教书匠金旭亮
和马斯克学辩论
埃隆·马斯克这两天不只是和杨立昆在辩论,而且还被动的开辟了第二战场,哈利波特系列作品的作者JK罗琳也和他就川普定罪问题展开了辩论(我是旁观了一下,没有立场),但是倒是发现马斯克的一个辩论技巧,他很会掌握两个辩论原则。
原则一:要不断质疑对方;原则二:不要回应对方的质疑,只需坚持自己的观点。
- 微博 高飞
苹果的锁屏密码确实无法破解
从我已知的情况,苹果的锁屏密码确实无法破解,需要嫌疑人告知密码或已知密码(不绝对,看后面)。很老的版本可以破解,应该是x之后就没办法了,checkmate漏洞之后的ios锁屏密码是无法破解的,更早的还有ipbox破解,就是现在找不到古董机了。最新的ios17更甭提了,基本上不用想破解。国内做取证的那几家公司:平(截图里用的就是它家)、盘、美、歆等这些也无法突破苹果锁屏密码。安卓下可以破解的就多了,因为太多版本太杂我不能一概而论或一一列出。
如果说在iphone x之后的版本有可能以色列的cellebrite公司可以,它们长期为执法机构提供服务。就是那个曾经fbi花了90万美元破解一个iphone的公司。后来便宜了,几千美元破解一个,听起来fbi像是冤大头。所以也不完全是无法破解,只不过就算有这技术也是掌握在少数人手里。
- 微博 sunwear
软件的终结
软件制作成本很高。你必须支付人员费用来创作、维护和分发软件。因为软件制作成本高,所以它必须盈利。而我们也为此买单——软件许可、SaaS(软件即服务)、按座定价等。软件的利润率历来让人羡慕——90%以上的利润率和零边际分发成本。
软件昂贵是因为开发人员昂贵。他们是熟练的翻译者——将人类语言翻译成计算机语言,反之亦然。大语言模型(LLM)已证明在这方面非常高效,并将把软件制作成本降至零。当软件不再需要盈利时会发生什么?我们将经历一场软件的寒武纪大爆发,就像内容一样。
SaaS、ARR(年度经常性收入)、魔法数字——这些都是理解旧软件商业模式的术语,其中与软件制作相关的开支曾是护城河。市场的无形之手在软件领域已停滞很久,但大语言模型将引入其迅速而熟悉的纠正力量。今天主修计算机科学将如同90年代末主修新闻学一样。
- 微博 宝玉xp
媒体观察
2024过半,AI大模型卷到哪儿了?
在国内,以阿里、百度为代表的科技大厂还在持续投资,比如阿里就耗资8亿美金,投资了Kimi的母公司月之暗面,占股36%,市场传闻腾讯也在洽谈跟进。
然而,对于推动原始创新和产品落地,这些大厂究竟发挥了多大作用、扮演着什么角色,我们越来越难以评估。大厂一方面自己做大模型,同时又投资了市面上几乎所有的明星创业公司,用股权把对手绑定。甚至这一波被开发者称赞的API降价,也不是由大厂发起,而是一个叫幻方量化的私募巨头,以及创业公司智谱AI带头,随后的大厂跟进,充满了被动和营销的味道。
下半年,行业依然会很卷,毕竟国内大模型从一开始就是竞争驱动的。也许,我们能卷出来几个赢家,爆款应用也不远了?
- 定焦
ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜
LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。
Django框架的创始人之一、著名开发者Simon Willison最近发表了一篇博客文章,核心观点是——虽然很多LLM看起来有记忆,但本质上是无状态函数。
文章地址:https://simonwillison.net/2024/May/29/training-not-chatting/
Mozilla和FireFox的联合创始人、JavaScript发明者Brendan Eich也在推特上称赞这篇博客。
- 新智元
华为鸿蒙:今年全面挑战谷歌苹果
在软件和互联网行业,弯道超车还可能吗?
这个问题具体到移动操作系统,面对已建立起统治地位的谷歌和苹果,华为鸿蒙还有机会打破对手的垄断吗?
- 智百道
马斯克凭借xAI再次成为世界首富:净资产2103亿美元
在撰写本文时,埃隆·马斯克的净资产为 2103 亿美元。
即使他每天花 100 万美元,也需要几百年才会花光现金。
- 鞭牛士
RISC-V会被制裁吗?能吗?
RISC-V 社区不希望其指令集架构 (ISA) 受到出口或进口制裁,因为这会影响采用并加剧分裂。它希望通过让立法者、政策专家和官员了解社区认为开源和开放规范之间的细微差别来避免打击。
简而言之,他们希望强调的是,对某种产品(例如,某种计算机处理器、付费软件应用程序,甚至开源项目)施加贸易限制是一回事,但对开放标准或规范施加限制则是另一回事。例如,禁止出口某些以太网网络控制器与直接禁止整个以太网出口是不同的。
- 半导体行业观察
AI大脑让机器人更像人了
大语言模型技术第一次成功模拟了人类的语言系统,让机器人实现与人类自然对话。AI(人工智能)大模型技术的快速更新又让机器人陆续拥有了类似人类的“眼睛”和“耳朵”等感官。
- 经济观察报
今日推荐
开源项目
dunglas/frankenphp
https://github.com/dunglas/frankenphp
FrankenPHP 是一个基于 Caddy Web 服务器构建的现代 PHP 应用服务器。特性包括:Early Hints、worker 模式、实时功能、自动 HTTPS、HTTP/2 和 HTTP/3 支持等。
每日一博
从 0 到 1:广告营销多智能体架构落地全攻略
在 AI Native(人工智能原生)时代,广告营销平台经历了根本性的变革,这些变化不仅提升了广告的效率和精准度,还重塑了广告行业的整体运作方式。其中,强大的广告营销智能体是下一代商业广告平台面向客户交付商业价值的首要载体。进一步,生成式 AI 又是广告营销智能体的内核及灵魂,真正达成让客户放开说、简单用、都搞定的极致体验。
开源之声
用户观点
中国软件行业几乎全军覆没
- 观点 1:接触过印度和老美的软件外包企业,那才叫你求生不得求死不能,特别是欧美那边指定的印度外包企业。国内算好的了
- 观点 2:某些国内大厂产品迭代速度慢比蜗牛,甚至做完一批产品就裁一半开发(依据KPI),然后还996搞起,这种厂子GDP贡献再大,也是行业肿瘤,死不足惜,倒是一些小厂,外资,倒了可惜
- 观点 3:往往是一群不懂软件的人在瞎叫唤。因为,这个列表里的公司根本代表不了国内软件行业最先进的公司。
- 观点 4:作为甲方祝愿用友早日倒闭
- 观点 5:狠狠地支持。一个zf单本来可以养活10个创业公司,现在通通被所谓高资质的外包拿走,养活他自己1个,技术嘛白嫖社区和大厂,人员嘛用完就开,我不养闲人,项目质量能交差就行,管他二期能不能拓展,呵呵。
- 观点 6:一群人卷大家都会做的,最后大家一起死
- 观点 7:有点极端,看看甲方的烂需求和预算。
- 观点 8:除了科大讯飞有一个输入法的 toC 业务,都是 toB 的,倒闭了都没什么大影响,还能多点订单给普通创业公司
- 观点 9:软通这种包工头企业为啥能亏钱,想不通
- 观点 10:现有项目和东软对接,对方啥也不懂
花2万买MacBook当然是用来安装Linux
- 观点 1:突然想到了,这个家伙还在世的时候还是要好好珍惜一下他,毕竟他创造了当今应用范围最广的操作系统,而且是全人类开放使用的,所以别忘了这一点。
- 观点 2:我肯定不是mac用户啊,如果单位发苹果电脑肯定第一时间装Linux。
- 观点 3:为什么都用arch不用debian
- 观点 4:因为arch的滚动更新特性就不适合企业使用,个人使用也不会优先选择滚动,只有两种人会选,小白和大佬,前者只会装逼,遇到滚挂基本傻眼,后者可以自定义到lts内核,遇到问题也可以快速解决,普通人不如先从乌班图玩起。
- 观点 5:我只想反过来在Linux电脑上装mac系统
- 观点 6:肯定是装 windows 啊,然后 wsl 跑 arch
- 观点 7:但是我想用Arch
- 观点 8:不如先从manjaro开始!
- 观点 9:用过了,不好用,他们用的是自己的repo
- 观点 10:残废系统,装过两次,一点都不好用,TouchID 没了,触控板也不好用了
- 观点 11:我自己买的Mac肯定是在虚拟机里安装Linux
- 观点 12:要是你只需要命令行的话,用multipass装Ubuntu,很香,非常香,体验和wsl类似
- 观点 13:都说老旧电脑装 linux,上次我用 xp 时代的电脑装了 ubuntu,卡的不行
- 观点 14:你那玩意只能安装centos或debian
Java是最能打的编程语言
- 观点:1:我 C# 不服
- 观点 2:Java纯粹是历史原因,尾大不掉。
- 观点 3:啥不是历史造就的,繁荣和衰败都是,编程也一样
- 观点 4:我 Kotlin 不服
- 观点 5:出来的晚,没啥不可替代的本事。
- 观点 6:世界是c#的,也是java的,但归根结底是c#的
- 观点 7:上一个这么说的还是php
- 观点 8:用的多不等于重要。系统级语言以外的都是蝼蚁。JAVA的市场份额萎缩到 1/4,应用范围是节节败退。 js和Python,只是脚本。被wasm和mojo惦记。错失机会,都不多看它一眼的,就是C#。
- 观点 9:在web开发领域中,相对于其他语言,如果JAVA未实现这个库,其他语言大概率更不会实现,庞大的生态无可比拟
- 观点 10:骗兄弟可以,别把自己骗了就好
- 观点 11:Foreign Function & Memory API 好像当前版本并没有比jni来得快,甚至更差了,而且在vallhala出来前java所有和c的交互都得额外弄一份内存,就算出来了也未必能做到一份二进制数据直接丢到内存当结构体用,等两个api完全稳定了,黄花菜都凉了
- 观点 12:java 淡出历史舞台了
同样写Python,同样做开源,大佬出手不仅斩获近万颗star,还被诺贝尔奖得主邀请会面
- 观点:1:你们python就这么不方便吗?以至于出个包管理器都这么隆重?
- 观点 2:虽然你说了个大实话,不过除了cargo这种伴生的,谁的包管理都是一团麻,golang颠颠倒倒,大金主拿捏的spm swift磕磕碰碰,bundle,venv,npm都不容易啊~ 倒回去点makefile/cmake也算得上包管理 哪一个拿出来都是大家伙~~
- 观点 3:万能的网友,有人能告诉我那个截图的终端画面,字体和主题配色是啥吗
- 观点 4:主题看起来像dracula,字体看起来像recursive mono semicausal,感觉像是,错了当我没说
- 观点 5:pip不好用么?
- 观点 6:我觉得Python poetry就挺好用的
- 观点 7:额,这和python -m venv有什么区别吗?
- 观点 8:这个蛮好用的,最近刚开始用
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!