欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.5.16
今日要点
OSI 即将给出开源 AI 的定义
OSI 小组自 2022 年以来就启动了一项深入的全球倡议,让主要参与者(包括企业、学术界、法律界以及代表更广泛民间社会的组织和非营利组织)参与进来,共同起草 Open Source AI Definition。
经过了几个月的会议及草案版本和审查。 OSI 表示,他们已经接近 Open Source AI Definition 的稳定版本;在接下来的几个月里,他们计划在北美、欧洲、非洲、亚太地区和拉丁美洲举办研讨会路演,以征求对草案的进一步意见。目标是能够在 10 月于北卡罗来纳州罗利举行的 All Things Open 上提出该定义的稳定版本。
Java SE 2024 年春季路线图
Oracle 发布了 Java SE 2024 年春季路线图,再次确认将对 Java/JDK 11 的支持延长至 2032 年 1 月,并免除 Java 11 支持的延期支持费用。此延期为依赖 Oracle Java 11 的 Oracle 客户提供了至少八年的支持和更新。
同时,在 Solaris 操作系统上的 Java SE 8 和 Java SE 11 支持分别延期至 2030 年 12 月和 2032 年 1 月。意味着 Solaris 上的 Java 支持相较 2019 年宣布的日期又延长了六年。此外,Oracle 计划将来在 Oracle Solaris / SPARC 服务器上支持 WebLogic 14.1.2。
Flutter 3.22 和 Dart 3.4 发布
Flutter 3.22 和 Dart 3.4 已正式发布,提供了一些性能改进和特定于平台的改进。
包括改进的 Impeller 渲染引擎、更流畅的视觉效果和更低的 iOS CPU 占用率、通过 Android 的预测性 back 手势增强的平台导航功能、通过 Google Mobile Ads SDK 扩展的盈利能力,以及 DevTools 中新的强大的 deep link validator。
deepin V23 RC
今日观察
社交观察
在北京微软工作的,应该是不想去美国的
1. 昨传言微软让北京AI团队的人选,是不是去美国,去可以带家属,帮搞定签证。后来微软又说传闻夸大了,是轮岗,不影响国内运营。
2. 这事应该不是瞎传,很多人收到邮件了,不然也不会有新闻出来。细节有些模糊,所以微软说夸大。但可以肯定,一些核心的AI研究小组肯定要动了,去美国、去爱尔兰,不会留在中国了。美国那边大气氛就这样,核心的AI研发不会放在中国了,微软会有压力。
3. 微软在中国公关搞得不错,主观上应该不想和中国脱购。但是美国现在气氛是,抓住人工智能当“救命稻草”,指望有大突破领先中国,甚至是唯一希望了。一头是自己研发,另外一头就要防范中国跟随性研发,想了很多坏主意,GPU芯片不让卖。甚至都说不搞开源了,怕中国用开源的大模型搞研发。
4. 在北京微软工作的中国员工,应该是不想去美国。在中国拿很好的工资,生活成本低得多,是不错的工作。跑美国去,即使收入上升,现在大家也知道了,很不方便,花费高得多,一堆生活要安排。跑爱尔兰之类的地方,生活成本都暴涨。可以肯定实际收入会大幅下降,能存的钱少多了。但是不去吧,又可能要找工作,一些人肯定在烦。
5. 和以前显著的不同是,现在大家觉得在中国,要是有收入不错又稳定的工作,生活是非常好的。感觉糟糕的,主要是没找到好工作的、工作不稳定的。
6. 微软要把一些好工作,从中国搬去美国、欧洲。这是大形势,美国政客闹腾的。中国的发展任务之一,就是要创造更多的研发好工作,让人才可以留下来,顺心地生活、研发。现在生活条件真的不错了,房价都降了好多。企业、政府、社会,增加研发投入,让搞研究的人安心生活、努力突破。趋势是不错的,美国人下狠手,中国不少行业明显增加了研发投入。
- 微博 风云学会陈经
GPT-4o 让闭源往前冲了一截,但我依然对开源有信心
前一段有开源和闭源之争,GPT-4o又让闭源系统的能力往前冲了一截,但是我依然对开源世界有信心。
坦率的说,可能我们又落后了,但这个落后我觉得也就不到一年,我还是坚持我的观点,中国发展大模型应该坚持两条腿走路,一条路是跟着OpenAI,但是用开源的思路,另一条路就是继续走应用之路,走企业场景化的专业大模型之路。
- 微博 周鸿祎
不懂就问,你们觉得哪款AI大模型更好用?
但要我说,你降价还不如把大模型做得更好,消费者用AI大模型看重的是好用、响应速度快、分发渠道更广,价格其实是次要的。我个人觉得目前最好用的肯定是百度的文心一言,毕竟在应用和智能体的分发上确实做的要比豆包好N倍,而且本身也是最大的AI应用场景之一,B端企业正向反馈更多,分发量已达日均数百万次。
况且文心大模型日处理Tokens文本已经达到2490亿,两者相差1290亿,在一至四月里,百度大模型中标数量和金额也是高居首位,中标项目数量多、覆盖行业多、中标金额高,这足以看到B端用户确实更倾向前者;虽说豆包和文心都是用的公有云+闭源技术路线,但百度李彦宏之前也说过,在大模型场景下,开源反而是最贵的,所以开源模型也必定会越来越落后。
- 微博 Oneline科技
开源免费的网页资源嗅探插件 cat-catch(猫抓)
它能够帮你筛选列出当前页面的资源,同时提供嗅探、缓存捕捉、视频录制等各种工具帮助抓取资源。并且可以在设置内添加想要抓取的资源类型,包括视频、图片等资源。支持 Chrome、Edge 以及 Firefox 浏览器安装使用。
GitHub:github.com/xifangczy/cat-catch
- 微博 GitHubDaily
媒体观察
腾讯研发了快一年的混元文生图模型,说开源就开源了?
腾讯AI靠开源追进度?
文生图模型成熟之后,有多少人苦练Midjourney咒语,还是调不出可用的图像?
设计界的专业名词、不太准确的英文翻译、理解不了的中国古代建筑充斥在目前文生图工具中。
本质上是源于国内很多团队基于翻译+英文开源Stable Diffusion模型,或者基于少量的中文数据在一些特殊的场景做了finetune,而这两种方式都存在对中文理解不足和不通用的问题。
针对这些痛点,腾讯带着中文原生的文生图大模型来了。5月14日,腾讯宣布开源混元文生图大模型,是国内首个中文原生的DiT架构模型,具备中英文双语理解及生成能力,在古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色。
- 品玩
树莓派冲刺IPO,估值35亿但年营收19亿,CEO:做一家有趣又赚钱的公司
消息人士透露,6月初树莓派可能于伦敦完成上市,预计估值超过5亿美元(折合人民币约36亿)。
目前树莓派官网已经公开一系列IPO相关文件。从去年年底开始,就有树莓派要IPO的消息传出,加之Arm牵头完成了对树莓派的最新一轮融资。其估值快速从3.76亿美元飙升至如今的5.6亿美元。
《金融时报》最新分析认为,在IPO后其估值可能接近6.3亿英镑(折合美元7.99亿)。
- 量子位
OpenAI掌门人最新专访:GPT-4o让我爱不释手,下代大模型可能不叫GPT-5
OpenAI近日发布了其最新的大语言模型GPT-4o,再次引领了人工智能领域的又一创新浪潮。在此重要时刻,该公司首席执行官山姆·奥特曼(Sam Altman)接受了知名播客节目主持人罗根·巴特莱(Logan Bartlett)的专访,向全球观众揭开了发布会背后的精彩故事,并提供了他对人工智能未来的预测。
在这次专访中,奥特曼不仅详尽地阐述了OpenAI的宏大蓝图,还探讨了实现AGI(通用人工智能)的时间表,以及人形机器人可能带来的深远社会影响。与此同时,奥特曼也对人工智能个人助理的前景表达了自己的兴奋与忧虑,并强调了当今人工智能领域最大的机遇和风险等。
- 腾讯科技
国外资深科技记者:Google I/O大会不接地气 根本听不懂
谷歌和所有科技公司一样,需要我们这些消费者来理解这些东西。如果他们希望我们对它们的产品感到兴奋,就需要让我们知道,这些AI工具是什么,它们具有多大的变革性。如果我们对它们感到兴奋,可能就会购买它们。例如,也许我们会购买下一代Pixel手机,就是因为Gemini,及其引人注目的视频提问服务。
但是,一场持续两个小时的演讲,让经验丰富的科技记者也摸不着头脑,难以理解,这不是解决问题的方法。谷歌花了很长时间谈论它的AI在总结事物方面有多么优秀,也许是时候让谷歌自己来使用这些工具了。
- 新浪科技
美国立法者寻求320亿美元拨款:让美国人工智能领先于中国
据路透社报道,包括美国多数党领袖查克·舒默在内的两党参议员周三呼吁国会批准为人工智能研究提供320亿美元资金,以保持美国在这一强大技术方面领先于中国。
包括共和党人迈克·朗兹(Mike Rounds)、托德·杨(Todd Young)和民主党人马丁·海因里希(Martin Heinrich)在内的参议员宣布了这一目标,作为解决人工智能的前景和危险的立法路线图的一部分。
舒默周三表示,如果中国要投资 500 亿美元,而我们什么都不投资,他们将不可避免地领先于我们。这就是为什么这些投资如此重要。
该路线图可以帮助美国解决对中国人工智能进步日益增长的担忧。
- 鞭牛士
今日推荐
开源项目
dwisiswant0/apkleaks
https://github.com/dwisiswant0/apkleaks
PKLeaks 是一个开源的 apk 文件敏感信息扫描工具,扫描 APK 文件来获取 URI、端点和 secret 信息。
每日一博
大模型真要取代程序员了?最危险的岗位是......
如今,随着大模型在编程、代码生成、自动化测试等领域展现出越来越强大的能力,一个引人深思的问题浮现出来:大模型会不会最终取代程序员的工作?
有些人认为,世界上本就没有哪项工作是绝对安全的,机器取代人工本就是迟早的事。从 GitHub Copilot、ChatGPT 到国产的通义灵码,各类替代工具纷纷涌现。AI 会做得越来越多,人类做得越来越少。百度 CEO 李彦宏就曾说过,基本上以后不会存在 “程序员” 这种职业了,因为只要会说话,人人都会具备程序员的能力。
但另一些人,则持不同的观点。他们认为:“低端程序员会消失,有创造力的程序员会做大”,“编程仍是基础,是必须要学的,程序都看不懂,再有创造力也没用”。360 CEO 周鸿祎就觉得,程序员热十年内不会减弱。尽管未来人人都会用电脑,所谓人人都是程序员,但不同的人用电脑创造的产品完全不一样,AI 时代更需要计算机专家和程序员,他们可能是各行各业最有发言权的。
那么,真实的情况是怎样的?大模型技术到底能取代哪些工作,又会如何影响程序员的职业生涯?作为普通程序员,应该如何适应变化?
事件点评
诈骗分子利用 TeamViewer 转走 398 万!远程桌面厂商该如何作为?
反诈任重道远,远控只是他们利用的一个工具而已,即使没有远控,他们也会有其他的方式,然而远控却在某种程度上提高了他们诈骗的效率。
我们不期望所有厂商像我们一样屏蔽手机被控,因为这种方式太极端,也损害了正常用户的利益,但我希望看到其他厂商能提出自己的解决方案,甚至组织安全联盟,制定出规范的反诈技术标准。
点评
这一事件对远程桌面软件行业和网络安全产生了重要影响,突显了远程桌面软件可能被滥用的风险。同时,对远程桌面软件厂商提出了更高的安全要求。为了防止其产品被用于非法活动,厂商需要采取更加严格的安全措施,比如加强用户验证、增加安全警告提示等,以保护用户免受诈骗侵害。
这也提醒了用户在使用远程桌面软件时要提高警惕。用户需要了解如何安全使用这类软件,避免在不安全的网络环境下使用,不轻信远程请求,尤其是涉及财务操作的情况。
OSI 即将给出开源 AI 的定义
考虑到目前有许多组织都在声称他们的 AI 为 “开源的”,但事实上还没有公认的方法来验证 AI 的开放性。因此,Open Source Initiative (OSI) 正在着手推动全球多利益相关者一起来定义 “Open Source AI”。
“正如 Open Source Definition 是全球公认的开源软件标准一样,Open Source AI Definition 也将成为 AI 系统及其组件的开放性标准。”
点评
首先,这一定义的制定将有助于规范和促进开源AI的发展。开源社区在软件领域有着明确的过程和原则来处理错误,但在AI领域,类似的框架和指导原则尚不完善。通过制定开源AI的定义,OSI可以为开发者提供指导和框架,帮助他们在开源AI的开发和使用中做出更好的决策。
其次,这一定义的制定也反映了AI技术的复杂性和多维性。AI系统与传统的软件系统相比,具有更多的不透明性和复杂性。如何将开源原则应用于这些“黑箱”式的自动化决策系统,是一个挑战。定义开源AI将有助于解决这些问题,促进AI系统的透明度和可理解性。
最后,这一定义的制定还将影响AI的全球治理。目前,AI的全球治理框架和标准尚不完善,开源AI的定义将为这一领域提供重要的参考和指导。这对于保护用户权益、促进AI技术的健康发展具有重要意义。
周鸿祎:GPT-4o 让闭源往前冲了一截,但我依然对开源有信心
前一段有开源和闭源之争,GPT-4o 又让闭源系统的能力往前冲了一截,但是我依然对开源世界有信心。
坦率的说,可能我们又落后了,但这个落后我觉得也就不到一年,我还是坚持我的观点,中国发展大模型应该坚持两条腿走路,一条路是跟着 OpenAI,但是用开源的思路,另一条路就是继续走应用之路,走企业场景化的专业大模型之路。
点评
周鸿祎这一观点反映了当前开源与闭源技术竞争的复杂性,以及中国在全球技术竞争中的战略思考。周鸿祎的观点表明,虽然闭源技术在某些方面取得了进展,但开源仍然具有其独特的价值和优势。同时,他也强调了在技术发展中保持开放和多元化的必要性,特别是在大型模型这一快速发展的领域。
这一观点对开源社区、技术开发者以及政策制定者都具有启示意义。它提醒我们在追求技术进步的同时,不应忽视开源社区的价值和潜力,以及在技术发展和创新中保持开放和多元化的必要性。
开源之声
媒体观点
微信开始扛起腾讯跑了
毫无疑问,游戏、社交是腾讯商业泵血的两棵大树;原本只有一棵(游戏)是“摇钱树”,如今另一棵(微信)也成了“摇钱树”。
- AC冲锋号
比行业价格便宜99.3%,字节跳动打响AI大模型价格战最响一枪
根据火山引擎现场公布的价格计算和对比,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。
这一极具竞争力的定价的公布意味着,国内其他大模型厂商现在或许需要重新制定自己产品的定价策略。但需要指出的是,豆包在强调极致低价的同时,没有在发布会现场给出测评和跑分方面的信息。
- 蓝鲸财经
大模型“聚会”:国内卷价格,国外卷能力
或许国内大模型厂商是想借助价格战,尽快让大模型帮助企业带动营收增长,进而对冲大模型前期高昂的研发成本投入,以及相关硬件方面的投入。
但随着国内大模型厂商在价格上持续内卷,或将影响到不少技术能力优越但资金实力不足的初创企业,这又是否会让中美在大模型方面的技术能力差距被拉开得更高呢?
- DoNews
从技术走向落地,行业大模型正从“小”场景倒推
我们到底需要怎样的生成式AI?一边是各大科技巨头纷纷推出自身的大模型产品,开启疯狂卷参数模式,另一边,随着对大模型能力认知逐渐深入,开始有越来越多的企业关注大模型相关应用在B端的落地。
今年以来,垂直于细微场景的轻量化、小参数模型开始涌现,可以说,各大厂商纷纷推出大模型产品形成“百模大战”的局势仅是序章,现在才真正进入“战役”——如何更好地在行业侧落地大模型产品。
- 钛媒体
用户观点
华为现场演示AI文生图时出现sleep代码,请问time.sleep(6)起到了什么作用?
- 观点 1:扯淡的6秒,那是6毫秒才对,编程的sleep都是毫秒,6秒是6000
- 观点 2:你说得对,但python是秒
- 观点 3:每次高考后大家都讨论高考作文。因为这是大部分人唯一能看懂的了
- 观点 4:在如今多线程阻塞和通信机制这么成熟的环境下,没有使用sleep常量时间的任何理由。
- 观点 5:最搞笑的是,一群人看到ret.write说是读取图片,给我整无语了
- 观点 6:后续优化的伏笔
- 观点 7:我认为没有什么不合理的,等待6秒是给AI生成图片留足够时间,以防展示图片的时候图片还没有渲染生成完成。为什么是6秒可能是测试后一个比较保险的等待时间。毕竟这只是一个发布会的展示demo,这么处理很合情合理。个人感觉这个拿出来说事儿的要么是初学代码一知半解感觉自己很nb,要么就是他是懂流量的
- 观点 8:为什么要等ai 6秒。 这个调用不能用异步吗?调用api 万一7秒呢 写程序怎么可能会写死6秒 这简直不可思议 别说等ai了,万一网断了怎么办,异常判断和延迟处理绝对不会用固定时间来这样糊弄吧
- 观点 9:理性吃瓜 防止打脸
- 观点 10:之前鸿蒙还没完善,代码放出来好多都没实现,直接返回的比比皆是
- 观点 11:没那么复杂,回复说graceful shutdown的应该才是正经码农。。Ctrl+C产生中断,一般都会设计一个优雅退出时间,比如6秒,6秒还自己不能清场,就直接杀进程。这才是比较符合常识的可能性。其实说那么多都没用,真想较真的话,自己装一套mindx,看看源代码里是啥就知道了。
- 观点 12:但是从图中 Traceback 来看是先 sleep 之后才收到中断信号,并不是中断后才执行 sleep。 正经的 graceful shutdown 不会拦截中断信号进行 sleep,最后再给自己发中断信号吧?
- 观点 13:确定性时延 哈哈哈哈哈哈哈哈哈
- 观点 14:有时候会为了能看清某些流程会 sleep 一下,具体情况还是得看场景
- 观点 15:善用sleep 让你的身价翻倍,只要sleep写的好你就可以摸鱼很久假装在优化 不开玩笑的话我个人认为跟文中说的一样是为了方便展示设置的临时sleep,如果是等调用反馈的时间这个太死板太弱智了...
- 观点 16:勇于现场演示代码已经不错了。不考虑上下文,空想sleep没用吧,拉下代码仔细看看再评论。
- 观点 17:可能是调用部分写得随意了点而已,就这点代码不能说明是假的
- 观点 18:我日常工作都是python,不懂sleep(6)秒咋了,有啥问题!
- 观点 19:避免答案过快输出,承让友商 6秒钟。
诈骗分子利用 TeamViewer 转走 398 万!远程桌面厂商该如何作为?
- 观点 1:我给自己的账户转几万块钱都被风控了,这个398万是怎么办到的,银行应该对此负责😂
- 观点 2:银行不做啥,怪到远程桌面上了,柿子还真就捡软的捏~?
- 观点 3:国内的金融类APP都是禁止截屏的啊,远程操作都是黑屏的。他们怎么做到远程操作APP的?
Vue3 开发新范式,不用 `ref/reactive`,不用 `ref.value`
- 观点 1:直接用 react 挺好,何苦来糟践 vue。
- 观点 2:看起来更麻烦了
- 观点 3:还是ref直观
- 观点 4:这是要把script给去掉么
- 观点 5:搞个新语言吧,别搞vue了
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!