开源日报 | AI程序员造假;“纯血”鸿蒙真机界面;谷歌发明“无限注意力”技术;成为顶尖程序员的最佳方式

2024年 4月 15日 81.7k 0

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.4.15

今日要点

国家天文台人工智能工作组发布大模型 “星语 3.0”

中国科学院国家天文台人工智能工作组发布新一代天文大模型 ——“星语 3.0”。“星语 3.0” 基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列 --Mini “司天”,可实现自主控制望远镜进行观测、分析观测结果,智能地给出下一步观测建议。

苹果 iOS 18 的首批 AI 功能将完全运行于设备端

彭博社记者 Mark Gurman 报道称,苹果计划为 iOS 18 推出的首批 AI 功能将完全在端侧上运行,不依赖云服务器。iOS 18 预计不会包含苹果自己的类 ChatGPT 的聊天机器人,但目前还不清楚 Gemini 或其他聊天机器人是否会直接集成到 iOS 18 中。

Gurman 补充,苹果可能未来会提供一些基于云端的 AI 功能,此前有报道称苹果已经和 Google、OpenAI 和百度等公司就 AI 上的合作进行了讨论,不过有知情人士否认了百度和苹果之间关于 AI 的合作。

科技媒体 MacRumors 则分析认为苹果仍有可能推出自家基于云的生成式 AI,因为此前也有消息指出,苹果正在积极购买 AI 服务器。

马斯克宣布 Grok-1.5,上下文长度至 128K

马斯克xAI的多模态模型Grok-1.5V横空出世了!不仅多项基准测试超越GPT-4V,而且看懂梗图写Python代码也都不在话下。并且,为了评估模型对于真实世界的空间理解,xAI此次还推出了新基准RealWorldQA。

今日观察

社交观察

HarmonyOS NEXT 真机上手

博主 @Flanker_017 在微博晒出 HarmonyOS NEXT 真机上手图,展示了新系统的操作界面。博主透露,新版本中原生 Android 应用已经无法使用。“如果本地数据多的,比如微信聊天、笔记软件,还是得给方案的,否则即使能从云端重新拉,用户体验也太差”。

- 微博 Flanker_017

中国是人工智能大模型开源最大的受益者

中国不仅成了人工智能大模型开源最大的受益者,甚至是唯一受益的国家。一旦美国公司公开源Chat GPT和Grok背后的软件,中国几十家公司马上一涌而上,纷纷拷贝后推出自己的模型。其他囯家如日本和德国,不会有公司这么做,因为可以直接使用美国的大模型,即使做了,用户也会特别少,肯定是亏本的买卖。

- 微博 猴年马月的中国

通过游戏化的方式来学习编码是成为顶尖程序员的最佳方式

- 微博 黄建同学

媒体观察

首个AI程序员造假被抓,Devin再次“震撼”硅谷,扒皮视频文字详解附上

不久之前震撼硅谷的Devin,再度震撼硅谷——但这次是被打假。事情是这样的:油管程序员博主Internet of Bugs(以下简称光头哥)对Devin的视频进行了逐帧分析,逐一举证说明了Devin并不如演示中那般神奇。

其它“罪证”,包括但不限于:

  • 号称能解决任何Upwork任务,但演示中解决的问题并不是prompt要解决的那一个,做无用功;
  • 看起来在修复bug,实际上修复的bug人类程序员根本就不会犯;
  • 没有意识到简单两步就能解决问题,花里胡哨一顿操作,其实是自己把任务搞复杂了;
  • 修改代码的水平一言难尽。

此外,光头哥花了半个多小时,把Devin演示视频中的upwork任务完成了一遍——而Devin完成任务可能用时6个多小时。

- 量子位

2024年生成式人工智能进化成什么样了?

AIGC交互界面的用户友好性、大模型开源及API(应用程序编程接口)价格的降低、插件服务带来的应用生态繁荣等,都使得AI技术或将成为像水、电、网络一样的基础设施,渗透并改变千行万业。

根据爱设计等多平台联合发布的《2024年AIGC发展趋势报告》,在医疗领域,AI的应用已能够精准辅助诊断,例如Google Health的深度学习模型,在乳腺癌筛查中的准确率已超越人类专家。利用强大的图像识别和模式分析能力,这些模型可以从成千上万的X光片中识别出极易被人眼忽视的细微变化。

- 北京青年报

挑战英伟达,谁最可能成为颠覆者?

在人工智能浪潮里掘金的“铲子”成了硬通货。GPU(图形处理器)是发展人工智能的关键芯片, 科技巨头英伟达凭借其GPU在人工智能芯片市场一家独大,占据约80%的份额。

AI芯片价格高昂,依然稀缺,Meta、谷歌、超威半导体(AMD)、英特尔、微软等科技巨头纷纷挑战英伟达的市场统治,推出对标产品。芯片大战愈演愈烈,谁是潜在颠覆者?

-  澎湃新闻

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

当人们还在比拼上下文窗口的时候,谷歌发布了这样一篇论文《Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention》。论文中写到,团队发明了一种新的注意力技术,叫做“无限注意力”(Infini-attention),通过这项技术,能使transformer大模型在有限的计算资源条件下,处理无限长度的输入。

-  品玩

今日推荐

开源项目

lihaoyun6/AirBattery

https://github.com/lihaoyun6/AirBattery

AirBattery 是一款用来在 Mac 菜单栏或者程序坞(Dock)上显示你的所有苹果设备电量信息的开源工具,只需要这些设备在同一个局域网内即可。

对于 iPhone 或插卡版 iPad 可以通过蓝牙显示电量,无需局域网。 ​​​

每日一博

C++ 从遗忘到入门

本文主要面向的是曾经学过、了解过 C++ 的同学,旨在帮助这些同学唤醒 C++ 的记忆,提升下自身的技术储备。如果之前完全没接触过 C++,也可以整体了解下这门语言。

事件点评

微软向美国军方 “推销” DALL-E

The Intercept 日前公布的文件显示,微软曾于 2023 年 10 月向美国军方推荐,使用 OpenAI 开发的图像生成工具 DALL-E 来帮助构建执行军事行动的软件。

而就在今年 1 月份,OpenAI 对其 AI 模型使用条款进行一番大更新:将原本禁止的 “军事与战争” 从页面中删除,留下的只有禁止使用 "我们的服务伤害自己或他人",包括 "开发或使用武器"。

微软在 PPT 中重点介绍了 OpenAI 可提供的各种 “常见” 用途,其中就包括了国防。且文件中例举的 “高级计算机视觉训练” 下的一个要点是 “战斗管理系统”:使用 DALL-E 模型创建图像,训练战斗管理系统。

点评

这一事件引发了关于AI技术军事应用的伦理和道德问题的广泛讨论。微软和 OpenAI 的这一举措可能被看作是AI技术向军事领域的扩展,引发了公众对AI技术在军事应用中可能产生的负面影响的担忧。

也凸显了大型科技公司与军事机构之间日益紧密的联系。微软和 OpenAI 的这一合作可能成为其他科技公司与军事机构合作的先例,进一步推动军事机构采用高科技手段。还反映了开源社区对于AI技术应用的监管挑战。

彭博社:苹果计划以 AI 为重点的 M4 芯片改造 Mac 产品线

彭博社援引知情人士消息称,为了刺激低迷的电脑销售,苹果公司计划生产新的 M4 处理器以全面改造其整个 Mac 产品线,从而突出 AI 功能。

报道指出,M4 芯片将至少分为三个不同的级别,包括代号为 Donan 的入门级 M4 芯片、中端的 Brava 芯片和性能最高的 Hidra 芯片。这三个版本的芯片都将拥有高于 M3 的 AI 处理能力。

点评

苹果公司的这一决策对 IT 行业和人工智能领域产生了深远的影响。首先,它标志着苹果在 AI 领域的进一步深入,通过推出性能更强大的 M4 芯片,苹果能够提供更先进、更智能的 Mac 产品。这将增强苹果在高端计算市场的竞争力,特别是在需要高性能 AI 计算的场景中。

其次,这一举措可能对其他 PC 制造商产生压力,迫使他们也加大对 AI 技术的投入,以保持竞争力。随着 AI 在日常计算任务中的重要性日益增加,能够提供强大 AI 支持的产品将更受消费者欢迎。

微软在 Windows 11 “开始” 菜单中测试应用广告

微软已开始在 Windows 11 开始菜单中测试广告,该公司表示,这项新实验将帮助用户在 Microsoft Store 中找到新的 “出色” 应用程序。目前该试用版已在 Windows 11 Insider Preview Build 22635.3495 的 "一小部分 Insiders" 测试版渠道中推出。

这些广告将显示在 “开始” 菜单的 “推荐” 部分、最近添加的应用程序以及经常打开的文件和程序中。

点评

这一事件对 IT 行业和用户体验产生了影响。首先,它代表了微软在 Windows 11 中的新尝试,旨在提升用户体验和增加 Microsoft Store 的可见度。然而,这也可能引起一些用户的不满,因为广告可能会干扰他们的日常使用。

其次,这一事件反映了微软在盈利模式上的探索。通过在“开始”菜单中展示应用广告,微软可能会增加其收入来源,同时推广 Microsoft Store 中的应用。

开源之声

媒体观点

开源GPU,能否弯道超车英伟达?

说到开源,近年来,RISC-V开源指令集架构在CPU领域已经取得了巨大的成功,其开放、灵活、可定制的特点吸引了越来越多的关注和应用。如今,RISC-V也开始在GPU领域崭露头角,一些项目和产品已经取得了初步的成果。RISC-V能否在GPU领域复制CPU领域的成功?

面对英伟达在GPU领域的垄断地位,开源能否成为破局之道?

- 半导体行业观察

面壁不只要做中国Mistral,还要超过它

时隔七十多天,面壁在发布了MiniCPM-2B后又带来四个特性鲜明的模型,同时它还官宣了数亿元的新融资。

此次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。这是其成立后最大的一笔融资。这家常被拿来对标Mistral的公司,并不满足于只做一个“中国Mistral”,弹药充足后,它要把“打精锐”这件事进行到底了。

- 品玩

北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token

北大和字节联手搞了个大的:

提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Diffusion Transformer(DiT)。并且代码开源,短短几天已经揽下1.3k标星,登上GitHub趋势榜。

实验数据上,这个名为VAR(Visual Autoregressive Modeling)的新方法不仅图像生成质量超过DiT等传统SOTA,推理速度也提高了20+倍。

- 量子位

智谱AI张鹏亮相央视《对话》解读AI趋势:AGI仍有很多问题值得探索,尚未看到天花板

提及目前人工智能的技术革新,张鹏将其类比做“蒸汽机改良阶段”,他认为,业界已经基本一致地接受大模型是通向AGI(通用人工智能)的一个有效路径,但仍然有很多问题值得去探索。如果将目标定在AGI,其中每一个问题的突破都有可能带来飞跃式的发展,目前尚未看到天花板。

张鹏同时认为,有了大模型之后,未来人与机器之间的沟通,会越来越贴近自然语言的方式,这是人类所希望且一定会往这个方向发展的。但未来对程序员的定义会有变化,未来传统程序员会越来越少,而建立在机器和人之间新的沟通方式上的,所谓“新式程序员”可能会需要更多。他表示:大家讨论问题的时候很容易忽略另外一个因素——时间,容易高估技术的短期价值,低估技术的长期价值。

- 中国经济新闻网

用户观点

「纯血」鸿蒙真机界面曝光

  • 观点 1:Android Linux kernel 套nodejs
    • 观点 2:不管有没有套壳,如果它能把Windows市场啃下来一大半,我都要给它点赞
  • 观点 3:这个“纯血”也太中二了吧,底层不是安卓?不是 linux?重新写了指令集,重新定义了操作系统?
    • 观点 4:重写了 5 进制(西方 2 进制,苏联 3 进制,血统都不纯了)
    • 观点 5:底层早就不是安卓了,至于 Linux,大部分系统的底层都是类 linux 或者 unix系统,果按照你这个说法,那安卓和 iOS 都不是纯血的了纯血鸿蒙的定义一直都是剥离安卓底层,而不是 linux 底层
  • 观点 6:截图里的图标和小组件的圆角看起来好粗糙
  • 观点 7:华为的ICON还是那股味道,浓重的重机械风。next能不能成真的不好说。如果是十年前,应该会凉掉。2024年来说,现在多端开发成熟,华为只要不搞得太复杂,平移成本不大开发者都应该乐于入坑的。(考虑备案的事情,说明你的项目不赚钱)

腾讯云 4 月 8 日故障复盘及情况说明

  • 观点 1:就是自己做技术研讨分析,自我吸取经验,然后没了?!
  • 观点 2:多出现故障,不然很多上面的人以为技术人员都不重要了
  • 观点 3:赔偿呢???对用户的赔偿??
  • 观点 4:看来,阿里云出问题,其他云也只是围观吃瓜而已,丝毫没当成教训,下次还会有京东云、百度云、华为云故障......
  • 观点 5:大公司和小公司的区别就是大草台班子和小草台班子的区别......
  • 观点 6:灰度发布这么大的企业不应该有的呢?搞笑吧

彭博社:苹果计划以 AI 为重点的 M4 芯片改造 Mac 产品线

  • 观点 1:苹果的价格,确实有点高攀不起
  • 观点 2:内存 硬盘卖的太贵了
  • 观点 3:磁盘大部分情况512GB够用,但是内存都21世纪的第24个年头了,内存8G?还没手机内存大。😀

程序员梗图

---END---

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论