欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.7.25
今日要闻
Stack Overflow 2024 年度开发者调查报告
过去一年中共有 62.3% 受访者使用了 JavaScript,其次分别是 HTML/CSS(52.9%)和 Python(51%)。在开发者 “还未尝试但明年最想尝试的编程语言” 中,Python 夺得第一,超过了 JavaScript。此外 Python 也是正在学习编程的人中最受欢迎的编程语言,这一人群还表示,希望明年平均使用 12 种不同的语言。
龙芯3C6000服务器CPU流片成功
龙芯中科技术股份有限公司董事长胡伟武介绍,该公司在研的服务器 CPU 龙芯 3C6000 近日已经完成流片。实测结果表明,相比上一代服务器 CPU 龙芯 3C5000,其通用处理性能成倍提升,已达到英特尔公司推出的中高端产品至强(Xeon)Silver 4314 处理器水平。
据了解,龙芯 3C6000 是一款面向服务器市场的 CPU 产品,单硅片 16 核 32 线程,支持双路、四路、八路直连。该 CPU 采用龙芯自主指令系统 “龙架构”,无需国外授权。从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,龙芯中科均进行了重新设计,具有充分的自主性。龙芯 3C6000 处理器还将首次引入龙链 1.0,实现片间互连,成倍降低片间访问延迟。
Node.js 支持原生运行 TypeScript
Node.js 合并了为 TypeScript 添加实验性支持的 PR。根据 PR 的描述,开发者只需配置实验性 flag--experimental-strip-types
就可以执行 TypeScript 文件。
Node.js 会将 TypeScript 代码自动转译为 JavaScript 代码。在转译过程中,不会执行类型检查,类型会被丢弃 ——Node.js 团队称之为 "type stripping"(类型剥离)。
https://github.com/nodejs/node/pull/53725
瑞士要求所有政府软件开源
7 月 23 日,瑞士通过了「履行政府任务电子手段使用联邦法案(EMBAG)」,要求所有公共机构披露其开发或为其开发的软件源代码,除非涉及第三方权益或安全问题。此举旨在增强政府运作的透明度、安全性和效率。
除了要求软件开源外,EMBAG 还要求发布非个人和非安全敏感的政府数据作为开放政府数据(OGD)。这种「默认双重开放」的方法标志着瑞士政府向更大开放性做转变。
https://www.newsd.admin.ch/newsd/message/attachments/70497.pdf
OpenAI 对 GPT-4o Mini 模型进行免费微调
在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。
GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这是 OpenAI 计划中价格最高的层级。OpenAI 计划逐步将免费微调扩展到所有层级。免费微调将从现在开始持续到 9 月 23 日。
Mistral AI 发布 1230 亿参数 Large 2 大模型
继 Meta 昨天发布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。
该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下,并提供更强大的多语言支持和高级函数调用功能。
Mistral 公司表示,训练的重点之一是尽量减少模型的幻觉问题。该公司称,Large 2 接受的训练让它的反应更具辨别力,当它不知道某些事情时,它会承认自己不知道,而不是编造一些看似合理的事情。
Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面有非常明显的改进。它支持法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、汉语、日语和韩语。在编码方面,它支持 80 多种编码语言,包括 Python、Java、C、C++、JavaScript 和 Bash。
今日观察
社交观察
LLama 3 405B模型效果已经赶上目前最好的闭源模型
LLama 3 405B模型效果已经赶上目前最好的闭源模型比如GPT 4o和Claude 3.5,这算是开源届的大事,技术报告接近100页,信息很丰富,粗略看了一下,很有启发。这里就LLaMA 3的模型结构、训练过程做些解读,并对其影响、小模型如何做、合成数据等方面谈点看法。
其实405B的正确用法不是用来提供服务,而是用来蒸馏应用的基座模型,来提升基座模型能力。毕竟用闭源模型蒸馏成本太高了。当然,405b中文化方面需要改进。
- 微博
张俊林say
正在消亡的浏览器,要靠AI大模型满血复活?
只要 Web 不死,浏览器就一定不会消亡。但用户需求在变,技术也在也变,所以浏览器的演变是不可避免的。
或许,未来的浏览器会变成什么样的产品还没有定数,国产浏览器和海外浏览器都在进行相同或者不相同的探索。说到底,不只是浏览器,我们大多数人和厂商对于 AI 的应用都需要一个适应和学习的过程。
但基本可以肯定,隐私和 AI 会是浏览器未来的两大主线,前者让用户更放心地上网,后者让用户在这个信息纷杂的时代,更轻松地从大模型、从互联网获取需要的信息。
- 微信
雷科技
Meta Llama3.1技术报告隐藏的干货
大规模模型训练面临诸多挑战,包括硬件故障和稳定性问题。
报告提到,在54天的快照期间,共发生466次作业中断,其中419次是意外中断。有趣的是,其中两次中断是由"服务器机箱"故障引起的。更令人吃惊的是,在预训练阶段,有148块H100 GPU出现故障。
报告进一步分析指出:"约78%的意外中断归因于已确认或疑似的硬件问题。" 这一数据揭示了大规模AI训练中硬件可靠性的重要性。
- 微博 高飞
2023年中国数据库市场规模74.1亿美元,占全球7.34%
近日,中国通信标准化协会发布《数据库发展研究报告(2024年)》。 报告显示,2023年全球数据库市场规模首次突破千亿美金,约为 1010 亿美元,中国数据库市场规模为 74.1 亿美元(约合522.4 亿元人民币),占全球7.34%。预计到2028年,中国数据库市场总规模将达到 930.29 亿元,市场年复合增长率(CAGR)为 12.23%。2023 年中国公有云数据库市场规模为 320.15 亿元,较 2022 年增速46.1%,中国数据库市场规模稳步增长。
- 微博 盘石
OpenAI自研芯片帝国,全揭秘!
据The Information援引知情人士消息,OpenAI一直在招聘谷歌TPU部门的前成员,寻求开发AI服务器芯片,并一直在与包括博通在内的芯片设计企业洽谈开发这款新型AI芯片的事宜。
去年OpenAI CEO萨姆·阿尔特曼(Sam Altman)决定创办一家新公司,开发和生产新的AI芯片,并帮助建设芯片工厂、数据中心来制造和容纳这些芯片。此后他的计划几经曲折。但有迹象表明,他打造新芯片的努力正在成形,而且是从OpenAI内部开始。
OpenAI芯片团队由谷歌TPU前工程高级总监Richard Ho领导。该团队很可能会选择一家美国公司(如博通)来帮助其开发拟议的新芯片。
- 微信 芯东西
假开源真噱头?Meta再陷「开源」争议,LeCun被炮轰Meta只是开放模型
Llama 3模型并不是真正意义的开源,至少不是按照最严格定义的开源。开源意味着研究开发人员可以自由选择如何使用这些模型,不受限制。但在Llama 3的一些案例中,Meta对于一些许可的授权进行了限制。
例如,Llama模型不能用于训练其他模型;拥有超过7亿月活跃用户的应用程序开发人员则必须向Meta申请特殊许可证。
许多学者和研究机构也注意到了对于「开源」一词的滥用情况,许多标榜为「开源」的大模型都存在重大限制,「真假开源」存疑。
- 微信 新智元
媒体观察
人形机器人产业“火热”背后的冷思考
随着人工智能技术逐步成熟和机器人产业快速发展,越来越多人形机器人逐渐进入公众视野。面对人形机器人的“热”,行业人士表示应有冷思考,对于人形机器人行业的“一高五难”需有清楚认知,推动人形机器人发展需以应用驱动研究。
- 媒体滚动
《鸿蒙2030白皮书》解读:塑造下一代智能终端体验与产业生态
《鸿蒙2030白皮书》认为,在万物智联时代将为操作系统带来服务智能化、体验空间化,终端多样化三大机遇。鸿蒙2030的愿景就是致力于以用户体验为中心,打造全场景智能操作系统,携手生态伙伴为用户带来更美好的全场景智能生活,共筑万物智联的鸿蒙世界。
- 环球网
杭州市人民政府办公厅关于印发支持人工智能全产业链高质量发展若干措施的通知
鼓励企业开展算力关键技术研发攻关,市级按照有关政策给予支持。鼓励企业承担国家、省重点研发任务,加速形成重大科研成果,对符合政策规定的项目按国家、省实际到账资助经费的25%给予资助,资助金额不超过500万元。
- 杭州新天地
百川智能完成总额50亿元A轮融资,估值达200亿元,阿里、腾讯、小米等投资
这意味着,国内头部的大模型初创企业仍在进行激烈的融资暗战,目前MiniMax、月之暗面、智谱AI等公开估值均超200亿元,且头部VC、科技大厂以及国资产投等主流基金都已入场。腾讯、阿里还同时投资了智谱AI、月之暗面和MiniMAX,阿里还尤其激进,押注了目前市面上最受关注的“大模型五虎”。
- 搜狐科技
华为吸纳人工智能领域“天才少年” 加速AI研发布局
从此次发布的内容看,华为对“天才少年”的要求不限学校、不限专业、不限学历,但需要在数理化、计算机、人工智能等相关领域有特别建树并有志成为技术领军人物。
华为还表示,将为“天才少年”提供世界级挑战课题、大牛导师、全球化的平台和资源。
- 证券日报之声
北京上半年累计上线大模型71款,占全国四成以上
2024年上半年,北京市创新和高技术产业表现强劲,特别是在人工智能领域取得了重要进展,全市数字经济的增加值同比增长7.8%,其中信息服务业实现增加值4944.6亿元,同比增长12.4%,拉动GDP增长2.6个百分点。
- 新京报
提前曝光 Llama 3.1,Meta 为什么想做「大模型界 Linux」?
比肩世界上最强大模型的 Llama3.1 开源,社交平台 X 上,很多人将这一事件视为历史、拐点、史诗级时刻,这意味开源、闭源之间的差距进一步缩小乃至反超,还意味着开发者从此有了一个免费的最强基座模型在手。
- 极客公园
AI生成作品版权算谁的?番茄小说AI训练协议惹争议
多位番茄小说作者在社交平台晒出番茄小说发出的“AI训练补充协议”通知,内容显示,“甲方(番茄小说)可将签约作品的全部或部分内容及相关信息(如作品名称、简介、大纲、章节、人物、作者个人信息、封面图等)作为数据、语料、文本、素材等用于标注、合成数据/数据库建设、AI人工智能研发、机器学习、模型训练、深度合成、算法研发等目前已知或未来开发的新技术研发/应用领域。”
- 第一财经网
今日推荐
开源项目
EmbarkStudios/rust-gpu
https://github.com/EmbarkStudios/rust-gpu
Rust-GPU 是面向 GPU 编程的开源项目,目标是使 Rust 成为 GPU 着色器开发的 “一等公民” 编程语言和生态系统。
每日一博
得物 App 弱网诊断探索之路
本次实现的是被动弱网诊断,也就是不主动发起探测请求,被动采集 App 内的全部网络请求,再根据一定在策略计算出用户网络环境。相对于主动探测,被动探测不会浪费用户资源。尤其是在吞吐量计算方面,主动探测不仅会消耗用户流量,还可能会对正在进行中的用户网络请求产生影响。而且当用户网络环境不佳时,负向影响更加严重。
开源之声
用户观点
“开源模型是智商税” v.s. “开源AI是前进的道路”
- 观点 1:让他搞AI别用开源的编译器、操作系统、开发语言、训练推理框架等等试试
- 观点 2:百度这么多年闭源都闭出了啥垃圾?闭门造车还好意思diss别人,不知道自己的搜索引擎被上亿人diss吗?别再击穿道德底线了…如果还有底线的话
- 观点 3:你中文的可信数据有多少,简直去污染模型
- 观点 4:个人认为不开源的模型肯定比开源模型强,因为有些公司会拿开源模型稍微优化一下,再绕过开源协议,这样就变成闭源的了,瞎口嗨的,勿喷
- 观点 5:百度和meta说的完全是两个事......
- 观点 6:先不说开源模型和闭源模型比性能到底谁高谁低 开源是智商税的话 你robin的文心一言敢说代码里一点开源的成果都没用到吗? 你只要用了就算自己打自己脸吧?
- 观点 7:开源都不要钱哪来的税?
- 观点 8:自己在ollama上用阿里的Qwen2都感觉比百度的文心一言舒服。
齐向东:中国目前不会发生 Windows 全球性蓝屏这样的事故
- 观点 1:请说咱们自己的LINUX信创系统
- 观点 2:说的一点不严谨,,港台可没少受这次影响
- 观点 3:中国最大的网络安全公司不是360么?
深圳移动:线下解封“停机”需社保连续缴纳6个月以上
- 观点 1:实名制这么久,骚扰电话一个没少
- 观点 2:有点管的太多了,实名制就行了呗
- 观点 3:评论区里的,移动公司的行为上升到社会问题是吧?
- 观点 4:这还真不是上升到社会问题,而是深圳很多都需要社保卡的,新办理银行卡转账限额为0,手机卡......见微知著
- 观点 5:直接工信部投诉就完事了
- 观点 6:银行开卡要手机入网半年以上
- 观点 7:这是因为号码太好,值钱了,所以被人盯上了
- 观点 8:以前打电话人家还要猜你是谁,现在直接喊名字。
- 观点 9:没手机号也找不到工作啊
- 观点 10:问一下:没在深圳交社保的是不是就不能在深圳办理移动卡
- 观点 11:难怪说深圳移动不属于广东省
- 观点 12:大家可能误会移动公司的要求了,这个被封禁,应该是出现一些恶意行为。
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!