开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?

2024年 7月 15日 39.3k 0

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.15

今日要闻

OpenAI 新研发项目“草莓”曝光,用于提升大模型的推理能力

OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。

据知情人士透露,OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力,克服当前 AI 在常识性问题上的不足。

Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候,OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」,这是在现有模型「预训练」过程之后附加的步骤,可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」(Self-Taught Reasoner, STaR),都是通过训练数据的迭代来提升水平。

openKylin 2.0 RC

作为 openKylin 2.0 正式版发布前的一个重要版本,该版本除全面搭载社区重大特性成果外,还积极响应用户测试和反馈建议收集,累计修复 330+bug,包括系统安装、桌面环境、系统应用等主要模块。

开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?-1

Neo4j 开源基于 LLM 提取知识图谱的生成器:llm-graph-builder

LLM Graph Builder可以把非结构化数据,PDF、文档、文本、YouTube视频、网页等转换成存储在 Neo4j 中的知识图谱

利用大模型OpenAI、Gemini 、Llama3、Diffbot、Claude、Qwen等从非结构化数据中提取节点、关系及其属性(可自定义要提取的关系、节点)

主要特征:
1、知识图谱创建:使用LLMs将非结构化数据转换为结构化知识图谱。
2、提供Schema:提供您自己的自定义Schema或使用已有的现有Schema来生成graph
3、查看图表:在 Bloom 中一次查看特定源或多个源的graph。
4、AI聊天:对话即可查询与 Neo4j 数据库中的数据进行交互,还可提供来源的元数据(支持使用不同 RAG 方法(GraphRAG、Vector、Text2Cypher)进行知识问答)。

GitHub:github.com/neo4j-labs/llm-graph-builder

德国法院裁定 AI 发明可申请专利

德国最高民事法院联邦最高法院在日前的一起案件中裁定,由 AI 系统 DABUS 制作的午餐盒设计可申请获得专利。前提是,发明人这一身份必须归属于人类;具体来说,本案例中的发明人署名就是 DABUS 的作者。同时,申请书也要明确指出该产品是由 AI 构思的。

萨里大学法学与健康科学教授、Artificial Inventor Project 成员之一 Ryan Abbott 在一份声明中表示,该裁决 “确认了 AI 生产的发明是可保护的,并且自然人可以被列为发明人,即使该发明是使用 AI 产生的。”

开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?-2

今日观察

社交观察

LSP启动的那个进程的权限不小

最近在写自定义语言的LSP实现,发现LSP启动的那个进程的权限不小,不论是JetBrain或者VSCode应该不会去检查这个进程到底做了什么。双方只是在上架的时候扫描了一下,不过JetBrain的审核标准比VSCode高太多了。

因此编辑器的插件安装还是要谨慎,最好只能从商店安装,我目测肯定有开发者在做这个灰色生意了。

- 微博 lazypeople

清华提出多智能体协作框架

来自清华、北大、北邮和腾讯的一篇新研究开源了IoA框架,目标是创建一个平台,让不同的AI智能体可以组队处理复杂的任务。

例如,像AutoGPT和Open Interpreter这样的智能体可以聚集在一起,组合各自的独特技能,共同解决单个智能体可能无法解决的棘手问题。

主要特点:
- 互联网启发架构: 就像互联网连接人一样,IoA可以连接不同环境中的不同AI智能体。
- 自主嵌套团队组建: 智能体可自行组建团队和子团队,以适应复杂的任务。
- 异构智能体集成: 将具有不同技能和背景的智能体聚集在一起,有点像组建一支全明星团队。
- 异步任务执行:智能体可以执行多任务,使整个系统更加高效。
- 自适应会话流:会话流可自主管理,以保持智能体会话的结构性和灵活性。
- 可升级和可扩展: 可轻松添加新类型的智能体或处理不同类型的任务。

代码:https://github.com/OpenBMB/IoA

- 微博 量子位

程序员工作会消失吗?

即使AI使编程变得更容易,也可能不会减少对程序员的总体需求,而是可能创造更多的机会和需求。,如果"软件开发变得更便宜了,制作软件和程序员变得更高效了,不一定减少对程序员的需求,实际上可能增加了对程序员的需求。"

但是,如果换一个角度思考,虽然讨论中举例说Word的出现,没有让打字变少。但是客观讲,专业打字员工作确实消失了。也就是说,我们确实需要更多的人打字了,但是打字的人,是每一个人,而不是一个专业工种。

如果模型让编程变得容易,那么确实人人都可以是程序员,但是“程序员”这个工作,也真的可能会消失。“程序员”会消失,和“编程会更繁荣”,两个结论并不矛盾。

- 微博 高飞

基于 Rust 的开源「异构集群推理方案」

有个老哥基于 Rust 开源了「异构集群推理方案」,可组合多台 iPhone,iPad,Macbook 组成 Tranformer 推理服务器,运行 Llama3-70B 模型。释放老旧设备算力,支持 Linux、iOS、Windows 等老旧设备组成异构集群提供分布式 LLM 推理算力。

Github:github.com/evilsocket/cake

- 微博 斌叔OKmath

媒体观察

人形机器人“进步”神速

人形机器人功能的不断精进,不仅能提升人类生活便捷性、工作效率和生产力水平,还将改善医疗健康服务,丰富教育、娱乐体验等,为人类生活带来全方位、深层次的改变。目前,人形机器人发展动能愈加强劲

- 经济日报

研究称人工智能测谎利弊并存

研究人员说,这项已发表在《交叉科学》杂志上的研究表明,虽然利用人工智能测谎可能促使人们在交流时更加诚实,但也可能严重破坏社会和谐,毕竟如果人们更频繁地质疑对方撒谎,会增加人与人之间的不信任。因此,他们呼吁建立一个全面的法律框架,在利用好新技术的同时,降低其可能带来的风险。

- 新华网

谷歌DeepMind被曝抄袭开源成果,论文还中了顶流会议

大模型圈再曝抄袭大瓜,这回,“被告”还是大名鼎鼎的谷歌DeepMind。

- 量子位

一共28家!盘点今年融资1亿美元以上的“美国AI独角兽”

Crunchbase最近的数据显示,仅在2024年上半年,全球就有超过355亿美元流向AI初创公司。 在2024年上半年募集的六轮超过10亿美元的风险投资中,其中五轮是由人工智能公司募集,其他AI初创公司也募集到了超1亿美元的巨额资金。

- 华尔街见闻

AI for DB进入新竞争周期|企服国际观察

不过,从目前来看,AI与数据库的结合思路,也不仅仅是与向量检索相关。过去几年,像自治数据库、数据库自监控自诊断、将低代码+AI引入到text2SQL等等,都是业内企业客户还在探索、尚无定论的方向。

但也有业内人士警示,AI与数据库的结合仍然是个很新的技术方向,也可能存在技术的踏空。

- 钛媒体

MoE也有Scaling Law,「百万专家」利用率近100%!DeepMind华人挑战MoE极限

如果你熟悉当前LLM的主流架构,混合专家(MoE)技术想必是老朋友之一。有人甚至会说,MoE是使大模型崛起的关键因素之一。

开源的Mixtral、DBRX、Grok等模型都使用了MoE,而且根据Soumith Chintala等大佬的推测,GPT-4也是一个规模为8×220B的MoE模型。

- 新智元

AI大模型正在走向工业规模化

当下,AI大模型正成为产业新型基础设施并为千行百业提供智能服务,且以“基础大模型+行业数据微调”的范式推动AI研发生产从传统小规模作坊式走向工业规模化量产,与此同时,也为各行各业带来了前所未有的变革。

- 中国高新技术产业导报

今日推荐

开源项目

ekzhang/sshx

开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?-3

https://github.com/ekzhang/sshx

sshx 可让你通过网络进行快速、协作的实时终端共享。它具有实时协作、远程光标和聊天功能。它还采用 Rust 编写的轻量级服务器,速度快、端到端加密。只需一条命令即可安装 sshx。将其用于教学、调试或云访问。

每日一博

淘宝互动游戏之我养的鸡要旅行

去年写过一篇关于前端业务代码分层的文章《小鸡 PK 业务架构治理记录》,主要是针对于 rax 这个视图引擎的,本文的区别在于属于混合开发的模式,Phaser 游戏开发的内容占比甚至比传统的前端 rax/react 开发更多。对于我们的分层模式来说其实没什么区别,只不过多了一种渲染方式而已,用 phaser 渲染和用 react 还是 rax 渲染其实都没什么区别。

开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?-4

开源之声

用户观点

区区1万张表就把MySQL给整崩溃了

  • 观点 1:mysql 5.6 不能用还是咋地 为啥非要升级 我......
  • 观点 2:你听听,区区一万张表,这叫什么话
    • 观点 3:1万张表真的太少了
    • 观点 4:如果是做报表采集的话,一万张表还是正常的
  • 观点 5:Oracle 不就是希望 MySQL 日渐式微么
  • 观点 6:oracle团队可能正在对mysql 进行比较大的重构。估计mysql的屎山代码让oracle工程师都无语了。
  • 观点 7:但凡脑子正常点的,不会一个实例建10000张表,没有考虑到疯子
  • 观点 8:我的生产超过1W张表了,还好用的5.7
  • 观点 9:确实够拉跨的

Go语言有个“好爹”反而被程序员讨厌?

  • 观点 1:go难道不是因为开源社区的氛围才挨骂的嘛,啥都好,问题和缺陷修的很快,疑问无论是小白问题还是大问题都会细心和你解答,但是你的提案他们不可能接受,毕竟自己的人kpi更重要。与其说是个开源语言不如说是个开源产品
    • 观点 2:技术本身导致社区不够有趣,否则开源大神一个 fork,战地转移完全有可能
      • 观点 3:pr也是,自己的人pr特别热情做review合进去,外面的大牛来了就打太极,draft我们讨论一下。然后就没下文了。至于无名无姓的,呵呵,人家看都不会看一眼
  • 观点 4:感觉不如编程原神的rust
  • 观点 5:我怎么觉得这些都是优点呢
  • 观点 6:我觉得这是最舒服的语言
    • 观点 7:如果没有太多的 error 需要处理 写着真的很爽
  • 观点 8:性能案例作假
  • 观点 9:嫌error 处理多的,去试试java 的throw exception hell
    • 观点 10:go你每个err基本都要return,代码极其繁琐。java只要顶层try一下就行了,内部异常自动跳出。
  • 观点 11:依赖管理和命名返回都是垃圾设计
  • 观点 12:写业务是一蹋糊涂,真搞不明白国内还乐此不疲的PHP=Golang?
    • 观点 13:Golang>PHP
  • 观点 14:我一看到 肯 汤普森 在设计团队里才学的语言。然后发现go语言里的特性是很优秀的。唯一的问题是go语言太落后了。
    • 观点 15:感觉不落后,只是有些地方不太好用, 在写curd时,不能像c# 一样,前后端一气呵成, 遇到数据库有null字段,时间有null,时间格式化等,处理起来不太好用。
  • 观点 16:我的评价是不如php
  • 观点 17:我还是那句话 kotlin优雅yyds
  • 观点 18:如果支持重载就非常完美了
  • 观点 19:我觉得go的语法真的丑

苹果批准UTM SE,经典PC模拟器已上架App Store

  • 观点 1:好 ipados 终于有点生产力了 搞个windows 装点软件 不然ipad这么强大的性能就是摆设
  • 观点 2:活久见了
  • 观点 3:没有 JIT,靠 CPU 模拟,性能会差一截的。

Vue诞生10年,创始人尤雨溪推动“锈化”——通过Rust提升Web基础设施性能

  • 观点 1:以前流行js框架用js实现工具链实现自举,现在变成用rust提高性能
  • 观点 2:20年前奔四cpu,用JS写的网站飞快,现在4核8核,用vue写的前端感觉很卡。
  • 观点 3:vue老浏览器都打不开,兼容性不好
  • 观点 4:真没必要Rust,对于命令行工具来说go已经足够好了
    • 观点 5:可能还考虑到了wasm吧
  • 观点 6:前端被整的越来越卡,浏览器内存老高。

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?-5

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论