开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模”NoC IP”;华为有哪些能力是当前不可代替的?

2024年 5月 23日 29.9k 0

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.5.23

今日要点

开芯院发布全球首个开源大规模 "NoC IP":温榆河

北京开源芯片研究院(简称 “开芯院”)正式发布了全球首个开源大规模片上互联网络(Network on Chip,NoC)IP—— 研发代号「温榆河」,标志其在数据中心服务器芯片技术发展方面取得重要进展。

据介绍,NoC 作为面向数据中心服务器芯片除高性能处理器核之外的核心基础 IP,目前全球仅有 ARM 一家供应商,并在一定程度上限制 RISC-V 处理器核使用。

开芯院自项目成立以来,经过 18 个月的紧张开发,成功完成了支持 64 核互联的 NoC IP 开发和验证。目前,该 NoC IP 可交付企业进行评估,进一步推动了 RISC-V 生态的发展。

Kotlin 2.0.0 稳定版发布,K2 编译器已稳定

Kotlin 2.0.0 语言层面没有新特性,主要是引入 K2 编译器,提升了性能。官方此前介绍称,K2 编译器前端不仅仅是对旧编译器前端的重构,而是基于新架构从头开始的完全重写。

开发团队称他们已尽量减少破坏性更改的数量和影响,因此在开发阶段会 “有意识地避免在 Kotlin 2.0 中引入任何新功能”,并 “尽全力将代码从 Kotlin 1.9 迁移到 Kotlin 2.0 的影响降到最低”。

这个MCU AI软件,核心全开源

自从AI热潮降临,MCU的AI算力就愈发强大。对MCU来说,TinyML就是正在发生的变革。其最大的优点就是可移植性。在具有小电池和低功耗的廉价MCU上运行意味着,使用 TinyML,人们可以很容易地将ML以便宜的价格集成到几乎任何东西中。

SensiML作为TinyML的先驱,前两日宣布计划贡献核心IP、SensiML Analytics Studio作为新的开源社区协作项目的基础,从而在开源道路上迈出了大胆的一步。

今日观察

社交观察

不到500元!我买来了世界上第一款「串流掌机」

在Nintendo Switch登场之前,NVIDIA其实还做过很多有趣的尝试。

在NVIDIA的显卡业务还没有今天那样如火如荼的时候,他们曾试着同时开展过多种业务,其中就包括了基于ARM架构的Tegra处理器,只可惜由于功耗、发热等原因,Tegra处理器始终无法成为移动端市场里的主流,甚至一度还被冠以「高分低能」的称号。

然后,在某个时间点,老黄突然灵光一现。

如果说Tegra系列芯片因为功耗高、发热量大而遭到厂商弃用的话,那么我们自己制作一台游戏掌机,然后给它配备主动散热的话,又会得到什么样的结果呢?

而这,就是英伟达第一款Android设备——NVIDIA Shield的故事。

- 雷科技

简体中文压缩数据只有6TB

Common Crawl中文数据提取出来了,做了去黄等处理,发现简体中文压缩数据只有6TB,解压后30TB左右,繁体压缩数据6TB。中文数据到2019年冲到一个最大值,之后就回落了,不知道2020年具体发生了什么事情。。中文网页数据还是有点凋零。是不是有些网站不维护了? ​​​

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

- 微博 梁斌penny

软件开发者必知的 10 大学习原则

市面上有许多介绍脑科学的流行书籍,比如《思考快与慢》,《心流》,《终身成长》等等,但是很少有将脑科学跟具体行业结合,教你如何学习的书。

这篇文章就属于这个行列,其中列出了软件开发者必知的 10 大学习原则

举个例子,理解概念的过程:从抽象到具体再回到抽象。其中提到了语义波。通过“语义波”的学习方法,你将在抽象定义和各种示例间频繁切换。

示例的多样性越高越好,甚至错误的示例,在与正确的对比中,也能帮助你理解错误之处。比如当你在学习什么是常量时,见到一个被错误标记为非常量的可变变量。这一学习过程被称作“解包(unpacking)”。

通过这些不同的示例,你可以重新审视抽象定义,并对该概念形成更深刻的认识。这种深度理解来源于你如何将示例中的各个细节与定义中的抽象概念联系起来,这个过程被称为“重新封装(repacking)”。

- 微博 dingtingli

高端处理器芯片包含两个核心IP

高端处理器芯片包含两个核心IP:一个是负责计算的CPU Core,比如ARM Neoverse系列的V1/N1/V2/N2核等;另一个是将几十上百个处理器核互联起来的片上网络NoC(Network on Chip),可以看作是芯片内部的桥梁,比如ARM CMN-600/700系列IP。

“香山”高性能RISC-V处理器核是上述第一类IP,目前已经发展到第三代,性能可以达到ARM N2,前段时间刚在中关村论坛发布。D但是对于第二类NoC IP,尤其是单芯片百核级NoC,目前全世界只有ARM CMN系列可选(Arteris FlexNoC系列尚无实例),单次授权价格高达数亿人民币,而且还有诸多限制条款。

- 微博  包云岗

为啥文心对外都免费了还收我们这么多

完,这下厂内兄弟更要问了,为啥文心对外都免费了还收我们这么多,那只能是……“基于红海行业进行需求分层,针对品牌边际效应构筑生态壁垒。分析toC客户非理性异动,捕捉痛点开辟差异化迭代路径。通过认知折叠简化用户接入成本,拉伸对齐传统行业实现商业模式闭环”了开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模——generated by yiyan.baidu.com

- 微博  Rachel____Zhang

华为有哪些能力是当前不可代替的?

华为在工业软件和各种软件工具不可代替。华为带领合作伙伴搞定了EDA等80多款工业软件,还搞了大量软件开发工具。在华为之前,国内不是稀稀拉拉不成气候,就是一片空白,全被欧美、特别美国公司占领。这种情况下,万一发生类似俄罗斯处境时候,我们的相关领域会是一片狼藉,损失无法估量。也就是华为带领产业链兄弟连把这个领域快速填补了。

- 微博  前HR本人

媒体观察

“深度学习”三巨头之争,杨立昆回应:辛顿错了,AI不是核弹

“它(AI)不是炸弹,它不是用来杀人的,AI 是为了让他们(人类)更聪明。所以,我根本不明白这个类比。而且,AI 也没那么危险。我认为这些系统比实际情况要聪明得多。现在 AI 的问题是,未来的力量是否足够,你认为它是否也会破坏一些东西?我们可以触及到人类智能的系统,我们可以考虑如何让它更加安全。”杨立昆表示。

杨立昆强调,开源(AI 技术)很重要,是非常有意义的技术贡献。

- 钛媒体

微软研究院刘铁岩:AI for Science,憧憬一个人人都可参与科学发现的未来

「AI for Science预示着一种全新的科学发现范式。通过构建统一的科学基座模型,AI for Science将消除不同科学领域之间的壁垒,实现通过一个模型解决众多科学难题的目标。它还有望推动更加普及的科学探索范式,通过与基座模型交互,让每个人都能参与到科学发现的过程中。而为了实现这些愿景,我们必须要让科学基座模型超越人类语言的限制,去学习、理解大自然的语言。」

- ScienceAI

小米追击智能驾驶,前图森CTO王乃岩将加入

前图森未来中国CTO王乃岩将加入小米汽车,向小米技术委员会主席、小米汽车自动驾驶负责人叶航军汇报。此前,王乃岩主导图森未来中国的研发与管理工作,同时负责L2级辅助驾驶、L4级自动驾驶方案的开发落地。

更早之前,王乃岩博士毕业于香港科技大学,擅长深度学习,是深度学习开源框架MXNet的核心开发者,在计算机视觉与机器学习顶级会议与期刊上曾发表论文40余篇。

- 36氪

英国监管机构ICO调查微软“Recall”利用NPU截屏的工作方式

英国数据监督机构称,它正在"向微软询问"一项新功能,该功能可以每隔几秒钟对笔记本电脑进行截图。微软表示,Recall 将在计算机本地存储加密快照,是即将推出的 Copilot+ PC 的独有功能。

但信息专员办公室(ICO)表示,它正在与微软联系,以获得更多有关该产品安全性的信息,隐私保护运动人士称其为潜在的"隐私噩梦"。

- cnBeta

“白菜价”始作俑者、大模型 “价格屠夫”DeepSeek是谁?

在众多AI应用眼花缭乱地涌入市场时,AI公司深度求索(DeepSeek)上周公告DeepSeekChat已通过北京市生成式人工智能服务备案,或将很快向公众开放服务。

DeepSeek由知名私募巨头幻方量化于2023年4月创立。与月之暗面、智谱AI、Minimax、百川智能等获得大厂投资的AI初创公司不同,DeepSeek与科技巨头间并无直接关系。但这家公司仍然被视为一匹可能改变国内AI市场格局的“黑马”。

5月初,DeepSeek宣布开源第二代MoE大模型DeepSeek-V2。据介绍,该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的仅百分之一,这也让DeepSeek收获了“AI届拼多多”的名号。

- 蓝鲸TMT

今日推荐

开源项目

linuxmint/timeshift

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

https://github.com/linuxmint/timeshift

Timeshift 是一个应用程序,提供类似于 Windows 中的系统还原功能和 macOS 中的 Time Machine 工具的功能。Timeshift 通过定期对文件系统进行增量快照来保护你的系统。这些快照可以在以后恢复,以撤销对系统的所有更改。

每日一博

如何优雅地编写缓存代码

因此,缓存是什么,如何选择某一种缓存,都不是本文重点,今天就写写实际编码过程中,如何将缓存代码从业务代码中剥离出来,促使代码更简洁,更便于阅读。

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

事件点评

Meta 成立新 AI 委员会,全白人男性阵容引质疑

Meta 周三宣布成立一个只有白人男性成员的人工智能顾问委员会,将定期与 Meta 的管理团队会面,为公司的人工智能和技术进步提供指导。

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

点评

Meta的这一决策受到了广泛的质疑,因为它显然缺乏性别和种族的多样性。在一个日益全球化和多元化的世界中,一个全由白人男性组成的团队无法全面代表所有用户群体的需求和视角。

AI技术的发展需要考虑到伦理、偏见和公平性问题。一个缺乏多样性的顾问团队可能无法充分识别和解决这些问题,因为他们可能无法充分理解所有受影响群体的经历和挑战。

Meta作为全球知名的科技公司,其决策和行为对公众信任有着重要影响。这一决策可能会削弱公众对Meta在AI领域做出公正、负责任决策的信心。多样性是创新的重要驱动力之一。不同背景和经验的人能够带来不同的观点和想法,这对于推动技术创新至关重要。一个同质化的团队可能会限制这种创新潜力。

这一决策可能会对Meta的品牌形象和声誉造成损害,也为其他科技公司提供了一个警示,即在组建关键决策团队时,必须考虑到多样性和包容性,以避免类似的争议和负面影响。

Windows 11 将在中国区设备上安装「微软电脑管家」

微软近日发布了针对 Windows 11 的测试版更新,里面有一项变化提到:将在中国区设备上安装 PC Manager。

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

点评

这可能是微软为了更好地服务本地市场、提供更加本地化的系统管理工具所采取的措施。中国有着众多的电脑管理软件,微软通过预装「微软电脑管家」可能是为了在这个竞争激烈的市场中获得一席之地。

预装系统管理软件可能会对用户体验产生正面或负面的影响。一方面,它可以提供便捷的系统维护和优化功能;另一方面,如果用户感觉被强制使用某个软件,可能会引起不满。任何与系统深度集成的软件都可能引发用户对数据隐私的担忧。微软需要确保「微软电脑管家」在处理用户数据时是透明和安全的。

这一举措可能是微软构建和巩固其在中国软件生态系统中地位的一部分。通过提供官方认可的系统管理工具,微软可以更好地控制软件质量和用户体验。值得一提的是,在中国,遵守当地法律法规是企业运营的重要部分。微软可能需要确保其「电脑管家」符合中国的网络安全和数据保护法规。

ChatGPT 严重宕机,结果被造谣 “遭遇俄罗斯黑客入侵”

ChatGPT 出现重大宕机事故,涉及到 ChatGPT Web 端和移动 App。

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

点评

ChatGPT的宕机事件凸显了对于高流量在线服务平台而言,保证服务的稳定性和可靠性至关重要。宕机不仅影响用户体验,还可能对企业的信誉和财务状况造成影响。面对服务中断,OpenAI的危机管理能力受到考验。他们需要迅速定位问题、修复故障,并及时向用户通报情况,以减轻负面影响。

通过有效的问题解决和沟通策略,企业可以在用户中建立起信任。反之,如果处理不当,可能会失去用户的信任和支持。ChatGPT的宕机也反映出用户对于AI服务的依赖程度。随着AI服务在日常生活中扮演越来越重要的角色,任何服务中断都可能对用户的工作或生活造成影响。

此次事件可能会促使OpenAI和其他AI服务提供商在未来加强系统的冗余设计和灾难恢复计划,以提高服务的鲁棒性。对于那些散布虚假信息的行为,需要有相应的法律和道德约束。这不仅是对受影响企业的尊重,也是维护健康网络环境的必要措施。

开源之声

媒体观点

ChatGPT 会把学校干掉吗

一些传统理论也将受到挑战。以人才培养中常用的“木桶理论”为例,传统观点认为,一个木桶能装多少水,取决于最短的那块木板。但生成式人工智能时代,刘晓光提出新的观点——未来一个木桶盛多少水,取决于最长的一块板,“其他那些短的板怎么办,由其他人补齐”。

- 中国青年报

大模型降价,一场没有赢家的战争

降价的本质是要加速大模型落地。大模型不能只停留在写诗作画,还得“下基层”。降价的背后是通过触达千行百业和获取更大样本容量的合作案例,从中提取共性特征,形成合理、高效的大模型行业标准。

- 光子星球

AI创业,追逐风口但别轻信“红利”——专访AI人机交互专家季啸白

从长期来说,图像生成AI一定是和人类大脑协作,而不是取代人类的摄影和图像创作。摄影是对客观事物的捕捉,也是拍摄者情绪和思考的表达。我很喜欢画画和摄影,AI技术虽然在不断演进,但人类主动创作的主观表达是永远无法替代的。

- 扬子晚报网

王小川:大模型价格战会加速泡沫周期,我们做C端的就别掺合了

谈及近期大模型价格战,王小川对钛媒体App表示,价格免费是优势,但不一定是竞争力。To C是建立影响力的一部分,既有超级模型又有超级应用是做商业化成功失败的重要条件。而在市场规模和覆盖层面,中国的市场C(消费)端就比B(企业端)端大10倍,美国做ToB是特别好的生意。

- 钛媒体

用户观点

Windows 11 将在中国区设备上安装「微软电脑管家」

  • 观点 1:这玩意儿我装过两次,第一次死机重启,第二次卡成PPT,不知道它在搞什么
  • 观点 2:win11 ad版
  • 观点 3:早就装上了。但感觉没啥用。跟 360 那些 软件一个 鸟样
  • 观点 4:除了老坛酸菜,其他的一切都不考虑。win11 自23h2后安装软件慢得狠,也没看到别人说,我是个好几个机器都是一样,22h2没这毛病,泄露的win11老坛酸菜也有安装软件慢的毛病
  • 观点 5:我安装使用了快半年,没发现有啥好用的,而且UI有些地方很不合理,比如无法拖拽,路径、名称等显示不全。部分功能确实引起cpu飙升。比如查找重复文件,大文件,且只能选择非常挫。每次优化建议第一条就是锁定edge的首页,但是首页是被锁定到百毒拼音.com?dg=xxxxx这样的,所以,说是广告版,国内特供版,没冤枉它,可能还不如某数字安全卫士极速版😀

ChatGPT 严重宕机,结果被造谣“遭遇俄罗斯黑客入侵”

  • 观点 1:不DOWN机的服务不是好服务
  • 观点 2:让ChatGPT自己修复问题?^_^

报告:过去十年中,有四分之一的网页已经消失

  • 观点 1:我用4美元在Unstoppable Domains注册了个去中心化域名,一次注册,不用续年费。然后在ipfs空间网站上上传网页并解析域名,网页永远都存在。
  • 观点 2:放在那里也是成本,所以......就没了
  • 观点 3:大浪淘沙,没用的自然会被淘汰
  • 观点 4:小站点(个人站点)运营周期短,大的网站改一次版,就可能导致一些页面永久“消失”,至于社交媒体上的内容,设置可见时间、删除、账号被封禁、甚至运营方会主动屏蔽、降权某些语言的的博文~
  • 观点 5:app是不是消失的更多

Kotlin 2.0.0 稳定版发布,K2 编译器已稳定

  • 观点 :kotlin 做后端2年了,最大的感觉就是比java写起来更流畅

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

开源日报 | Kotlin 2.0.0;简体中文压缩数据只有6TB;AI不是核弹;全球首个开源大规模

相关文章

Java 之父 James Gosling 宣布退休
快手文生图大模型可图宣布开源
李彦宏:开源模型是智商税
VLMs多模态大模型当下进展与思考
开源日报 | 李彦宏称开源模型是智商税;Windows下的GUI开发;有趣的人形机器人;边学AI边赚钱
Meta 开源新的“多标记预测”语言模型

发布评论