欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.4.16
今日要点
华为自用的时序数据库开源啦,来看看水平怎么样?
2022 年底,又一重磅产品加入了开源时序数据库这一赛道,并在短短一年内在 60 余家企业测试和生产落地,吸引了 70 + 来自国内外重点高校和企业的贡献者 ——openGemini,华为开源的分布式时序数据库,主要聚焦于海量时序数据的存储和分析,通过技术创新,简化业务系统架构,降低海量时序数据的存储成本,提升时序数据的存储和分析效率。
百度宣布全球首个 AI 原生操作系统 DuerOS X
4 月 16 日,Create 2024 百度 AI 开发者大会在深圳举办。小度科技在会上宣布了全球首个 AI 原生操作系统 DuerOS X。
据介绍,该系统基于文心大模型进行了全面升级,在多模态感知和拟人化呈现方面有了重要突破。通过 DuerOS X,小度的人机交互体验将实现质的飞跃,为用户提供更加自然、智能的交互方式。
文心大模型是百度在人工智能领域的重要成果,它为 DuerOS X 提供了强大的技术支持。搭载文心大模型的 DuerOS X 不仅更加有用,也更具灵魂,能够为用户提供更多的情绪价值和陪伴价值。
苹果 App Store 下架抄袭开源项目的 Game Boy 模拟器 iGBA
苹果昨天从 App Store 下架了近期刚刚上架的 GameBoy 模拟器 iGBA,原因是该应用违反了 App 审核指南的垃圾内容(第 4.3 节)和版权(第 5.2 节)相关规定。
iGBA 是一款 Game Boy 模拟器,用户可使用它免费下载 ROM 来玩 Game Boy 游戏。iGBA 在苹果 App Store 上架后迅速获得了用户的关注,并跻身热门应用行列。然而,这款应用很快就被苹果公司下架,原因是它违反了苹果的应用审核指南中的垃圾信息和版权相关规定。
今日观察
社交观察
一张图看匿名竞技场开源vs.闭源LLM表现
- 随着时间的推移,模型的性能有不断提升的趋势,最新的GPT-4和Claude 3等模型表现更优。
- 开源和闭源之间的差距已缩短至6-10个月,GPT-4刚发布时该差距为几年。
- 在同类型模型中,闭源模型如GPT-4、GPT-4-Turbo、Gemini Pro等整体性能优于开源模型。但也有一些开源模型如Mistral、OpenChat-3.5等表现不错。
- 一些较早期的模型如GPT-3.5 Turbo、Vicuna、Llama等虽然性能相对较弱,但也有不错的性能表现。
- 微博 爱可可-爱生活
AI要怎么才能在工作和生活中给人提效,现在还需要大量的中间环节
比如微软在Office里加了那么多AI能力,但玩转这些能力有哪些技巧,或者普通人和专家的ChatGPT可能完全是两种智能水平,怎么写出最适合自己的Prompt,等等,这些都属于连接技术和需求的中间业务,有非常多的创作机会。
拿捏住了这类内容的专业性,也就拿捏住了AI公司做投放的偏好。
根据Quest Mobile的统计,今年国内AI产品的月活总量大概不到1亿,相当于10年前的短视频用户规模,增长空间很大,也意味着整个内容供应的天花板还远远看不到,如果真心相信这条赛道,什么时候入局都不晚。
- 微博 阑夕
使用 ebpf 动态追踪技术从 OpenJDK 8 的 JVM 进程取得完整的 Java 调用栈轨迹
我们团队的同学这两天已经使用 #ebpf# 这样的动态追踪技术,成功地从 OpenJDK 8 的 JVM 进程的任意一个时间点取得完整的 #java# 调用栈轨迹了。可以精确到 Java 代码行。
完全不需要 JVM 的任何配合,不依赖 JVM 的 Agent 或代码注入(既没有字节码注入,也没有机器码注入)。我们对目标进程是完全只读的。同时支持解释执行和 JIT 编译后的 Java 字节码。仅百微秒级损耗,适合线上生产环境使用。
- 微博 agentzh
李厂长今天一句逆天的话,得罪整个IT行业
李厂长今天又展现出了他的传统艺能:一句逆天的话,得罪整个IT行业。
怎么说呢,虽然这也算是半句实话吧——Kimi那边也表达过类似的意思,而且把话说得更重,「开源就是搅局」——但国内这些看不起开源社区的,本质上都是在给自己抬轿子,认为自家底座已经是最优解了,你们就别重复造车轮了。
问题在于,一年多的时间下来,无论是闭源还是开源,你们的作品都没有实际拉近和第一梯队的距离,我日均投入不低于3个小时在各个AI工具之间,完全能负责任的做出这个判断。
- 微博 阑夕
媒体观察
“AIGC第一股”,要来了!
近日,AI初创公司出门问问通过港交所聆讯,招股在即,拟在港交所主板挂牌上市。这意味着,出门问问有望成为“AIGC第一股”。
在业内人士看来,出门问问此番在港股上市,除了助力其在AI领域快速发展,更体现了国内AI发展取得阶段性成果,有助于鼓舞和启示其他AI企业发展。
出门问问的创业史堪称中国AI发展史的缩影,且每一步都走在科技浪潮的前沿。自2012年创业至今,历经移动互联网时代的语音交互软件时期、AIoT时代的智能硬件时期,并在2020年以业界首个AIGC产品“魔音工坊”开启大模型商业化的新时代。
- 中国基金报
一文看懂百度AI开发者大会:三大AI神器、文心4.0工具版生产力拉满
过去一年,李彦宏与创业者、开发者交流,感受到了“FOMO”状态的盛行,即“Fear of Missing Out”,既兴奋又担心错过。不过百度一直紧追大模型风潮,大模型和生成式AI也正在彻底改变开发者群体。
在今天的百度AI开发者大会上,李彦宏直言,过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,使每个人都有可能成为开发者,用创造力改变世界。这一天即将到来,因为强大的基础大模型和低门槛的开发工具,开发者的生产力得到了显著提高。
谈及百度的角色定位,作为技术公司,百度希望为大家提供所需的开发工具,不断提升整个社会的创造力。具体而言,百度提供了一系列强大的基础模型,如文心大模型系列,以及基于大模型开发各种应用的工具,如智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder和各种尺寸的模型定制工具ModelBuilder。
- 网易科技
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍
今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。报告指出,人工智能的发展正以惊人的速度向前推进,开发人员每月都在制造出越来越强大、越来越复杂的模型。然而,尽管发展速度加快,人工智能行业在解决人们对人工智能可解释性的担忧以及对其对人们生活影响的日益紧张方面却进展甚微。
在今年的报告中,斯坦福 HAI 研究所增加了有关负责任人工智能的扩展章节,有关科学和医学领域人工智能的新章节,以及对研发、技术性能、经济、教育、政策和治理、多样性和公众舆论的综述。
- 机器之心
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合,读懂梗图刷爆榜单,代码复现数学函数
贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了学术,用代码就能复现数学函数图。效果堪称是开源社区版的GPT-4+DALL-E 3王炸组合。
不仅如此,这款由港中文终身教授贾佳亚团队提出的多模态模型,一经发布便登上了PaperWithCode热榜。
- 新智元
今日推荐
开源项目
sxwdmjy/dy-java
https://gitee.com/sxwdmjy/dy-java
DyJava 是一款功能强大的抖音 Java 开发工具包,支持多种抖音开发功能模块的后端开发,包括但不限于移动 / 网站应用、开放平台、抖店和小程序等。DyJava 致力于简化开发流程,提高开发效率,让开发者能够更专注于创新和业务逻辑的实现。
每日一博
重新审视 CXL 时代下的分布式内存
随着摩尔定律增长的逐渐减缓,系统规模的水平扩展已经成为提升系统性能的关键策略。然而,这种扩展依赖于分布式系统架构的支持,而分布式编程的固有复杂性给构建高效、可靠及弹性的系统带来了严峻挑战。因此,简化分布式编程依旧是分布式编程框架追求的核心目标。
事件点评
苹果 App Store 下架抄袭开源项目的 Game Boy 模拟器 iGBA
苹果昨天从 App Store 下架了近期刚刚上架的 GameBoy 模拟器 iGBA,原因是该应用违反了 App 审核指南的垃圾内容(第 4.3 节)和版权(第 5.2 节)相关规定。
iGBA 被指抄袭了开发者 Riley Testut 的开源作品 GBA4iOS。GBA4iOS 一直以来都只能在苹果 App Store 之外获取,而 iGBA 在上架后,用户发现它与 GBA4iOS 存在高度相似性,并且加入了额外的广告。
点评
这个事件可能会引发一系列的讨论和反思。首先,这是对开源社区的一种不尊重,抄袭他人的开源作品并试图通过添加广告来盈利,这种行为是不被接受的。其次,这也反映出App Store的审核机制可能存在一些问题,需要进一步加强以防止类似的情况发生。
总的来说,这个事件提醒我们,尊重开源社区、尊重他人的创新成果是每一个开发者和公司应该遵守的原则。同时,也提醒我们,作为用户也需要更加关注我们使用的应用的来源,避免使用可能侵犯他人权益的应用。
李彦宏:自然语言将成为新的通用编程语言、开源模型会越来越落后
百度创始人、董事长兼首席执行官李彦宏今天在 Create 2024 百度 AI 开发者大会上发表了题为《人人都是开发者》的演讲。他认为,大模型和生成式 AI 将彻底改变开发者这个群体。
李彦宏提到,有了基础模型文心 4.0 之后,百度可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain(一种预训练的模型训练方法)。
这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。
基于这种对比效果,李彦宏放话称,“开源模型会越来越落后”。
点评
首先,李彦宏认为大模型和生成式AI将彻底改变开发者这个群体。这是一个有趣的观点,因为它预示着AI和机器学习将在未来的软件开发中扮演更重要的角色。这可能会导致开发者需要掌握新的技能和工具,以便有效地利用这些大模型和生成式AI。
其次,他提出自然语言将成为新的通用编程语言。这是一个大胆的预测,可能会降低编程的门槛,使更多的人能够参与到软件开发中来。他对于开源模型会越来越落后的预测则可能引发一些争议,因为开源一直被视为推动技术进步的重要力量。然而,如果百度等公司能够开发出性能更优、成本更低的模型,那么开源模型确实可能会面临挑战。
总的来说,这些观点和预测都反映了AI和机器学习在未来软件开发中的重要性,以及开发者可能需要适应的新的开发模式和工具。然而,这些预测的准确性还有待时间的检验。
《人工智能示范法 2.0(专家建议稿)》:重视 AI 开源发展
《人工智能法(示范法)》2.0 在此前版本的基础上不断更新,将基于负面清单实施的人工智能许可管理制度与负面清单外人工智能活动的备案制度明确区分,避免过重合规负担影响人工智能产业的经营预期;重视人工智能开源发展,提出促进开源社区建设、制定专门合规指引、明确责任减免规则等支持措施;构建知识产权创新规则,在研发环节对训练数据、个人信息的使用作出专门安排,并针对人工智能生成物的成果保护与侵权认定进行规定。
点评
这份法案重视人工智能开源发展,提出了促进开源社区建设、制定专门合规指引、明确责任减免规则等支持措施。这是一个积极的信号,因为它表明政策制定者认识到了开源在推动人工智能发展中的重要性,并愿意采取措施支持开源社区的建设。
还对开源人工智能的法律责任进行了减免。可能会鼓励更多的个人和组织参与到开源人工智能的研发中来,推动人工智能的创新和发展。
此外,这份法案构建了知识产权创新规则,在研发环节对训练数据、个人信息的使用作出了专门安排,并针对人工智能生成物的成果保护与侵权认定进行了规定。可能会为人工智能的研发和应用提供更明确的法律指引,降低法律风险。
开源之声
媒体观点
PK英伟达或“碰钉子”,AMD、英特尔在成为怎样的“挑战者”?
英伟达在AI芯片领域的霸权为市场带来的影响已足够深远。在这样的背景之下英特尔和AMD 能否扛起“挑战英伟达”的大旗?又该如何定位这两家巨头AI芯片产品的市场角色?
- 第一财经网
从“卷”训练到“重”推理,企业部署大模型有了“芯”要求
在消费者对ChatGPT等消费级AI应用进行尝鲜和玩票之后,企业也迎来了AI发展的转折点。相比2023年企业纷纷训练自己的大模型,2024年企业对大模型的关注转向推理,以实现差异化和变现。一方面,企业部署大模型对计算架构带来了新的挑战;另一方面,企业对推理的重视,也使其对算力架构的选择走向多元。
- 中国电子报
专委会副主任周鸿祎哈佛演讲:大模型创业要抓住中国机会
周鸿祎表示,发展专业大模型可能是中国的一个巨大机会,所有企业都值得让专业大模型重塑一遍。周鸿祎邀请哈佛毕业生回国进行大模型创业,共同合作闯出中国的AI之路。
中国可能会率先带来新的工业革命。中国现在传统行业门类最多,生产力、供应链最齐全,都在搞数转智改。所有的企业都需要让专业大模型重塑一遍,所有的工业级、所有的企业级软件都值得重写一遍。
- CCF计算机安全专委会
用户观点
李彦宏:自然语言将成为新的通用编程语言、开源模型会越来越落后
- 观点 1:这么看不起开源吗。👎
- 观点 2:先把搜索弄好再说
- 观点 3:前提是要能看懂代码
- 观点 4:百度总是起个大早赶个晚集。又要战略失误了
- 观点 5:说到底还是实力不足,除了搜索想不起百度搞定了哪件事?
微软在 Windows 11 “开始” 菜单中测试应用广告
- 观点 1:are you ok?
- 观点 2:理解万岁
- 观点 3:老坛酸菜版本没有这个广告,在等几天估计就出win11第一个老坛酸菜版本了。,😂
华为自用的时序数据库开源啦,来看看水平怎么样?
- 观点:大厂入局是好事
程序员梗图
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!