欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.7.15
今日要闻
OpenAI 新研发项目“草莓”曝光,用于提升大模型的推理能力
OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。
据知情人士透露,OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力,克服当前 AI 在常识性问题上的不足。
Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候,OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」,这是在现有模型「预训练」过程之后附加的步骤,可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」(Self-Taught Reasoner, STaR),都是通过训练数据的迭代来提升水平。
openKylin 2.0 RC
作为 openKylin 2.0 正式版发布前的一个重要版本,该版本除全面搭载社区重大特性成果外,还积极响应用户测试和反馈建议收集,累计修复 330+bug,包括系统安装、桌面环境、系统应用等主要模块。
Neo4j 开源基于 LLM 提取知识图谱的生成器:llm-graph-builder
LLM Graph Builder可以把非结构化数据,PDF、文档、文本、YouTube视频、网页等转换成存储在 Neo4j 中的知识图谱
利用大模型OpenAI、Gemini 、Llama3、Diffbot、Claude、Qwen等从非结构化数据中提取节点、关系及其属性(可自定义要提取的关系、节点)
主要特征:
1、知识图谱创建:使用LLMs将非结构化数据转换为结构化知识图谱。
2、提供Schema:提供您自己的自定义Schema或使用已有的现有Schema来生成graph
3、查看图表:在 Bloom 中一次查看特定源或多个源的graph。
4、AI聊天:对话即可查询与 Neo4j 数据库中的数据进行交互,还可提供来源的元数据(支持使用不同 RAG 方法(GraphRAG、Vector、Text2Cypher)进行知识问答)。
GitHub:github.com/neo4j-labs/llm-graph-builder
德国法院裁定 AI 发明可申请专利
德国最高民事法院联邦最高法院在日前的一起案件中裁定,由 AI 系统 DABUS 制作的午餐盒设计可申请获得专利。前提是,发明人这一身份必须归属于人类;具体来说,本案例中的发明人署名就是 DABUS 的作者。同时,申请书也要明确指出该产品是由 AI 构思的。
萨里大学法学与健康科学教授、Artificial Inventor Project 成员之一 Ryan Abbott 在一份声明中表示,该裁决 “确认了 AI 生产的发明是可保护的,并且自然人可以被列为发明人,即使该发明是使用 AI 产生的。”
今日观察
社交观察
LSP启动的那个进程的权限不小
最近在写自定义语言的LSP实现,发现LSP启动的那个进程的权限不小,不论是JetBrain或者VSCode应该不会去检查这个进程到底做了什么。双方只是在上架的时候扫描了一下,不过JetBrain的审核标准比VSCode高太多了。
因此编辑器的插件安装还是要谨慎,最好只能从商店安装,我目测肯定有开发者在做这个灰色生意了。
- 微博 lazypeople
清华提出多智能体协作框架
来自清华、北大、北邮和腾讯的一篇新研究开源了IoA框架,目标是创建一个平台,让不同的AI智能体可以组队处理复杂的任务。
例如,像AutoGPT和Open Interpreter这样的智能体可以聚集在一起,组合各自的独特技能,共同解决单个智能体可能无法解决的棘手问题。
主要特点:
- 互联网启发架构: 就像互联网连接人一样,IoA可以连接不同环境中的不同AI智能体。
- 自主嵌套团队组建: 智能体可自行组建团队和子团队,以适应复杂的任务。
- 异构智能体集成: 将具有不同技能和背景的智能体聚集在一起,有点像组建一支全明星团队。
- 异步任务执行:智能体可以执行多任务,使整个系统更加高效。
- 自适应会话流:会话流可自主管理,以保持智能体会话的结构性和灵活性。
- 可升级和可扩展: 可轻松添加新类型的智能体或处理不同类型的任务。
代码:https://github.com/OpenBMB/IoA
- 微博 量子位
程序员工作会消失吗?
即使AI使编程变得更容易,也可能不会减少对程序员的总体需求,而是可能创造更多的机会和需求。,如果"软件开发变得更便宜了,制作软件和程序员变得更高效了,不一定减少对程序员的需求,实际上可能增加了对程序员的需求。"
但是,如果换一个角度思考,虽然讨论中举例说Word的出现,没有让打字变少。但是客观讲,专业打字员工作确实消失了。也就是说,我们确实需要更多的人打字了,但是打字的人,是每一个人,而不是一个专业工种。
如果模型让编程变得容易,那么确实人人都可以是程序员,但是“程序员”这个工作,也真的可能会消失。“程序员”会消失,和“编程会更繁荣”,两个结论并不矛盾。
- 微博 高飞
基于 Rust 的开源「异构集群推理方案」
有个老哥基于 Rust 开源了「异构集群推理方案」,可组合多台 iPhone,iPad,Macbook 组成 Tranformer 推理服务器,运行 Llama3-70B 模型。释放老旧设备算力,支持 Linux、iOS、Windows 等老旧设备组成异构集群提供分布式 LLM 推理算力。
Github:github.com/evilsocket/cake
- 微博 斌叔OKmath
媒体观察
人形机器人“进步”神速
人形机器人功能的不断精进,不仅能提升人类生活便捷性、工作效率和生产力水平,还将改善医疗健康服务,丰富教育、娱乐体验等,为人类生活带来全方位、深层次的改变。目前,人形机器人发展动能愈加强劲
- 经济日报
研究称人工智能测谎利弊并存
研究人员说,这项已发表在《交叉科学》杂志上的研究表明,虽然利用人工智能测谎可能促使人们在交流时更加诚实,但也可能严重破坏社会和谐,毕竟如果人们更频繁地质疑对方撒谎,会增加人与人之间的不信任。因此,他们呼吁建立一个全面的法律框架,在利用好新技术的同时,降低其可能带来的风险。
- 新华网
谷歌DeepMind被曝抄袭开源成果,论文还中了顶流会议
大模型圈再曝抄袭大瓜,这回,“被告”还是大名鼎鼎的谷歌DeepMind。
- 量子位
一共28家!盘点今年融资1亿美元以上的“美国AI独角兽”
Crunchbase最近的数据显示,仅在2024年上半年,全球就有超过355亿美元流向AI初创公司。 在2024年上半年募集的六轮超过10亿美元的风险投资中,其中五轮是由人工智能公司募集,其他AI初创公司也募集到了超1亿美元的巨额资金。
- 华尔街见闻
AI for DB进入新竞争周期|企服国际观察
不过,从目前来看,AI与数据库的结合思路,也不仅仅是与向量检索相关。过去几年,像自治数据库、数据库自监控自诊断、将低代码+AI引入到text2SQL等等,都是业内企业客户还在探索、尚无定论的方向。
但也有业内人士警示,AI与数据库的结合仍然是个很新的技术方向,也可能存在技术的踏空。
- 钛媒体
MoE也有Scaling Law,「百万专家」利用率近100%!DeepMind华人挑战MoE极限
如果你熟悉当前LLM的主流架构,混合专家(MoE)技术想必是老朋友之一。有人甚至会说,MoE是使大模型崛起的关键因素之一。
开源的Mixtral、DBRX、Grok等模型都使用了MoE,而且根据Soumith Chintala等大佬的推测,GPT-4也是一个规模为8×220B的MoE模型。
- 新智元
AI大模型正在走向工业规模化
当下,AI大模型正成为产业新型基础设施并为千行百业提供智能服务,且以“基础大模型+行业数据微调”的范式推动AI研发生产从传统小规模作坊式走向工业规模化量产,与此同时,也为各行各业带来了前所未有的变革。
- 中国高新技术产业导报
今日推荐
开源项目
ekzhang/sshx
https://github.com/ekzhang/sshx
sshx 可让你通过网络进行快速、协作的实时终端共享。它具有实时协作、远程光标和聊天功能。它还采用 Rust 编写的轻量级服务器,速度快、端到端加密。只需一条命令即可安装 sshx。将其用于教学、调试或云访问。
每日一博
淘宝互动游戏之我养的鸡要旅行
去年写过一篇关于前端业务代码分层的文章《小鸡 PK 业务架构治理记录》,主要是针对于 rax 这个视图引擎的,本文的区别在于属于混合开发的模式,Phaser 游戏开发的内容占比甚至比传统的前端 rax/react 开发更多。对于我们的分层模式来说其实没什么区别,只不过多了一种渲染方式而已,用 phaser 渲染和用 react 还是 rax 渲染其实都没什么区别。
开源之声
用户观点
区区1万张表就把MySQL给整崩溃了
- 观点 1:mysql 5.6 不能用还是咋地 为啥非要升级 我......
- 观点 2:你听听,区区一万张表,这叫什么话
- 观点 3:1万张表真的太少了
- 观点 4:如果是做报表采集的话,一万张表还是正常的
- 观点 5:Oracle 不就是希望 MySQL 日渐式微么
- 观点 6:oracle团队可能正在对mysql 进行比较大的重构。估计mysql的屎山代码让oracle工程师都无语了。
- 观点 7:但凡脑子正常点的,不会一个实例建10000张表,没有考虑到疯子
- 观点 8:我的生产超过1W张表了,还好用的5.7
- 观点 9:确实够拉跨的
Go语言有个“好爹”反而被程序员讨厌?
- 观点 1:go难道不是因为开源社区的氛围才挨骂的嘛,啥都好,问题和缺陷修的很快,疑问无论是小白问题还是大问题都会细心和你解答,但是你的提案他们不可能接受,毕竟自己的人kpi更重要。与其说是个开源语言不如说是个开源产品
- 观点 2:技术本身导致社区不够有趣,否则开源大神一个 fork,战地转移完全有可能
- 观点 3:pr也是,自己的人pr特别热情做review合进去,外面的大牛来了就打太极,draft我们讨论一下。然后就没下文了。至于无名无姓的,呵呵,人家看都不会看一眼
- 观点 4:感觉不如编程原神的rust
- 观点 5:我怎么觉得这些都是优点呢
- 观点 6:我觉得这是最舒服的语言
- 观点 7:如果没有太多的 error 需要处理 写着真的很爽
- 观点 8:性能案例作假
- 观点 9:嫌error 处理多的,去试试java 的throw exception hell
- 观点 10:go你每个err基本都要return,代码极其繁琐。java只要顶层try一下就行了,内部异常自动跳出。
- 观点 11:依赖管理和命名返回都是垃圾设计
- 观点 12:写业务是一蹋糊涂,真搞不明白国内还乐此不疲的PHP=Golang?
- 观点 13:Golang>PHP
- 观点 14:我一看到 肯 汤普森 在设计团队里才学的语言。然后发现go语言里的特性是很优秀的。唯一的问题是go语言太落后了。
- 观点 15:感觉不落后,只是有些地方不太好用, 在写curd时,不能像c# 一样,前后端一气呵成, 遇到数据库有null字段,时间有null,时间格式化等,处理起来不太好用。
- 观点 16:我的评价是不如php
- 观点 17:我还是那句话 kotlin优雅yyds
- 观点 18:如果支持重载就非常完美了
- 观点 19:我觉得go的语法真的丑
苹果批准UTM SE,经典PC模拟器已上架App Store
- 观点 1:好 ipados 终于有点生产力了 搞个windows 装点软件 不然ipad这么强大的性能就是摆设
- 观点 2:活久见了
- 观点 3:没有 JIT,靠 CPU 模拟,性能会差一截的。
Vue诞生10年,创始人尤雨溪推动“锈化”——通过Rust提升Web基础设施性能
- 观点 1:以前流行js框架用js实现工具链实现自举,现在变成用rust提高性能
- 观点 2:20年前奔四cpu,用JS写的网站飞快,现在4核8核,用vue写的前端感觉很卡。
- 观点 3:vue老浏览器都打不开,兼容性不好
- 观点 4:真没必要Rust,对于命令行工具来说go已经足够好了
- 观点 5:可能还考虑到了wasm吧
- 观点 6:前端被整的越来越卡,浏览器内存老高。
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!