欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.5.15
今日要点
谷歌推出开源大模型Gemma2
谷歌将在今年6月发布开源大模型 Gemma 2,支持270亿参数。此前 Gemma 只有20亿参数和70亿参数两个版本。
根据谷歌实验室副总裁 Josh Woodward 的说法——谷歌优化了270亿参数的模型,使其可以在英伟达的下一代GPU、单一的谷歌云TPU主机和托管的Vertex AI服务上运行。
诈骗分子利用 TeamViewer 转走 398 万!远程桌面厂商该如何作为?
诈骗分子利用 TeamViewer 远程操控受害者手机银行,转走受害者 398 万。
联想到我们上周发表的文章,RustDesk 由于诈骗猖獗,暂停国内服务,很多人对我们的行为非常不解,甚至怀疑故意炒作,甚至有人在 GitHub 上说这是种族歧视,因为只是屏蔽中国。
反诈任重道远,远控只是他们利用的一个工具而已,即使没有远控,他们也会有其他的方式,然而远控却在某种程度上提高了他们诈骗的效率。
我们不期望所有厂商像我们一样屏蔽手机被控,因为这种方式太极端,也损害了正常用户的利益,但我希望看到其他厂商能提出自己的解决方案,甚至组织安全联盟,制定出规范的反诈技术标准。
字节开源大模型量化新思路,2-bit量化模型精度齐平fp16
近日,字节跳动语音团队推出一个全新的量化思路,抛弃传统的量化范式,从数学优化的角度来对量化任务建模。文章放在了 arXiv,代码已经开源。
今日观察
社交观察
Chrome内置Gemini的意义不在于Gemini,不在于Chrome
Google 宣布在 Chrome 里集成 Gemini Nano,使用方法目前主要靠在Web API 中新增的具体「Task API」(比如 translation API,似乎还会有摘要、问答、分类、AIGC)来调用结合专家模型(或经过微调)的 Gemini Nano,后续可能在 Web API 里增加更通用的 Prompt API 和 Fine-tuning (LoRA) API。这种模式不同于基于 WebGPU 在浏览器里运行 LLM,是直接在 Web 标准里增加 AI API。性能方面的区别主要是不用等待模型下载。
不过Chrome内置Gemini的意义不在于Gemini,不在于Chrome,也不在于「内置」 — Chrome在多数平台是第三方应用,推进这种Web API的初期不得不内置模型,实际上 AI Runtime 就像 XR/Web Runtime 一样应该内置在 OS 中
意义在于:包含目前主流 LLM / GenAI 能力的 Edge AI 开始被跨平台标准化了,就像 WebXR 一样。
区别不在于「Web 能不能调设备上的LLM」,现在如果 OS 里有 Edge AI 的 API,包个 hybrid app 也能调,或者自己加载个模型用 WebGPU 运行,自己封装 API
区别是进入 Web 标准的 Edge AI 能力会变成跨平台一致的基础能力,在上层衍生出更多跨平台的、建立在 EdgeAI 能力上的开源库和应用生态,进一步成为应用的「基础」。
- 微博 dexteryy
Google IO展现了一个类似微信视频通话的带有视觉的 AI 交互的手机和眼镜
今天 Google IO,发布了一个 Project Astra ,展现了一个类似微信视频通话的带有视觉的 AI 交互的手机和眼镜。
对,就是昨天 GPT-4o 展示的东西。而且,Open AI 展示的能力更强大,要说亮点,就是 Google 还展示了一个带摄像头的眼镜。
对,就是 Meta 已经卖了上百万条的 Glasses 那玩意。而且从技术上而言,Gemini 应该不是一个原生多模态的 LLM 。奥特曼提前一天发布 GPT-4o ,简直就是骑在 Google 头上抽他的脸。
未来闭源 Open AI ,开源 Meta 。Google 可以去死了。[鼓掌]
- 微博 李楠或kkk
拼多多这是闷声发大财
- 微博 电商报
阿里云与微软、Meta等共同制定下一代AI网络架构标准
阿里云成功入选超以太网联盟(UEC)技术咨询委员会,成为唯一的中国公司成员,将与微软、Meta、AMD、博通等其他12名成员,共同推进开放网络系统及核心技术的研发及标准制定,打造下一代AI网络基础设施。
在AI大模型时代,仅靠芯片性能提升已无法满足训练及推理的蓬勃算力需求,Linux基金会发起成立开源组织——超以太网联盟UEC (Ultra Ethernet Consortium) ,希望通过开源开放的技术合作促进创新,致力于打造面向AI时代的超大规模新型网络技术及系统。
UEC技术委员会是联盟中最核心的技术决策中心,只有技术实力过硬、对开源社区贡献大的会员机构才能入选。阿里云、Enfabrica、Marvell等3名成员,共同组成了新一届UEC技术委员会。在UEC联盟中,阿里云正牵头推进面向AI需求的网络性能提升项目等技术草案,并持续向成员分享阿里云最新的技术积累和实践。同时,阿里云也是开放网络SONiC社区7个发起成员之一和技术委员会副主席单位。
- 微博 阿里云
媒体观察
谷歌一夜亮出十几款产品对阵OpenAI:什么都有,只是没有惊喜
皮查太需要一场惊艳的发布会,拿回属于谷歌的牌面了。
所以与OpenAI的仅半个小时,集中在产品介绍的发布会完全不同。谷歌的I/O骨子里就透着一种武库尽出,拼死一战的意思。两个小时的发布会,它一口气拿出来十来款新品及升级,量大管饱,全面对标OpenAI在AI各领域上的发展。
很多产品单看Demo还是有着不错的完成度,但整场发布会没有一点像GPT-4o带来那样的惊艳感。因为他们发布的大多数是追赶那些OpenAI已有的东西,没人会为一些别人已经做到的事情感到惊艳。
最有可能带来惊艳感的新品——Gemini Astra的戏份已经被昨天的GPT-4o演完了。
到头来,想一秀肌肉的谷歌,还是被OpenAI四两拨千斤的卸了力。
我们更多的从它的搜索产品,模型产品上看到了谷歌的疲态,创新的缺失。
本想看巅峰对决,但实际上昨天这场对决就已经结束了。
- 腾讯科技
中国AI追随之路的五大误区
钛媒体集团创始人、董事长、CEO 长江商学院EMBA项目校友 赵何娟发表主题“中国AI追随之路的五大误区”的演讲。
第一大误区:中美AI差距只有1到2年。
第二个误区:中国是全球最大的AI专利和人才市场。
第三个误区:中国AI的主要障碍是在算力上“卡了脖子”。
第四大误区:闭源大模型 VS 开源大模型 谁更好?
第五个误区:AI 在各大垂直产业的爆发,会很快发生。
- 钛媒体
五大重磅更新速览!谷歌I/O开发者大会究竟公布了什么?
谷歌举办了年度I/O开发者大会,召开了长达两个小时的主题演讲。正如外界预期的那样,人工智能成为了这次活动的中心。在演讲中,这家科技巨头发布了众多有关人工智能的产品和服务:
一、Gemini的广泛升级
二、Veo、Imagen 3、音频概述
三、AI赋能谷歌搜索
四、Astra项目
五、AI芯片等硬件
- 财联社
今日推荐
开源项目
Tencent/HunyuanDiT
https://github.com/Tencent/HunyuanDiT
混元文生图大模型(下称:混元 DiT,Scalable Diffusion Models with Transformers)由腾讯开源,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。
每日一博
程序员如何提升个人技术影响力
都说程序员的成长是码出来的,此话不假。但如果既会写代码,还会写文章,还能讲 PPT,那你离影响力还会远吗?
本文是针对每一个技术同学都适用。我将从行业技术大会主编的角色告诉你,如何打造自己的技术影响力,有哪些通用的手段,我自己又该如何做个性化叠加;我是技术小白,或者我有一定技术基础,我又该怎么打造自己的影响力?
事件点评
微软中国 AI 团队集体打包去美国,涉及数百人
昨天许多网友在脉脉发布动态称,微软公司在邮件通知将中国区 Azure 人工智能团队的几个组集体打包去美国和澳大利亚。
网传消息显示,C+AI 团队做 AI platform 的 Azure ML 团队将集体打包去美国,另外也有一些组去澳洲的。收到邮件的人在 6 月 7 日之前要下决定,不走就裁员。涉及大约数百人。
点评
这一消息引发了关于微软公司全球战略调整和AI领域发展的讨论。首先,这一调动可能与微软的全球战略调整有关。随着技术的发展和市场的变化,公司可能需要在全球范围内重新分配其资源和技术人才。这次大规模的调动可能是为了更好地适应全球市场的需求,以及优化其在不同地区的业务结构。
其次,这一事件也反映了AI技术在全球范围内的竞争和合作。AI技术的发展不仅需要强大的技术支持,还需要全球范围内的合作和人才流动。微软的这一调动可能是为了更好地整合全球范围内的技术资源和人才,以推动AI技术的发展和创新。
最后,这一事件也引发了关于跨国公司内部文化和员工福利的讨论。大规模的调动可能会对员工的职业发展和生活造成影响,因此公司需要妥善处理员工的关切,确保员工的权益得到保障。
中美举行人工智能政府间对话首次会议
双方均认识到人工智能技术发展既面临机遇也存在风险,重申继续致力于落实两国元首在旧金山达成的重要共识。
点评
这次会议的举行标志着中美两国在人工智能领域的合作和对话的开始。在全球化背景下,中美作为两个最大的经济体和科技大国,在人工智能领域的合作至关重要。这次会议为两国在人工智能技术风险、全球治理等方面的交流提供了平台。
其次,会议中双方对人工智能技术风险的看法和治理举措的介绍显示了中美两国在人工智能治理方面的不同立场和策略。中方强调以人为本、智能向善的理念,确保人工智能技术有益、安全、公平,并支持加强全球治理。而美国则可能从安全和隐私的角度出发,关注人工智能技术可能带来的风险和挑战。
最后,这次会议对于推动全球人工智能的健康发展具有重要意义。中美作为人工智能技术的重要推动者,两国的合作和对话将有助于形成广泛共识的全球人工智能治理框架和标准规范,从而促进人工智能技术的健康发展。
华为:鸿蒙生态设备数量超 8 亿台
华为终端官博发布消息称,鸿蒙生态设备数量已超 8 亿台,180 款设备可陆续升级 HarmonyOS 4.2,覆盖手机、平板、手表、智慧屏等。短短 1 个月,升级用户已超 2000 万。
点评
这一数字突显了华为在操作系统领域的显著成就。鸿蒙生态设备的快速增长对整个操作系统市场产生了影响。华为的这一成就可能会激励其他厂商加大在操作系统领域的投入,推动整个行业的创新和发展。同时,这也表明华为在构建一个多元化的生态系统方面取得了成功,这对于操作系统的发展至关重要。
以及反映了华为在推动国产操作系统发展方面的努力。在当前全球技术竞争的背景下,发展国产操作系统对于保障国家信息安全和技术独立具有重要意义。华为的这一成就在这方面起到了积极的推动作用。
开源之声
媒体观点
净利润增长54%,腾讯“印钞”
腾讯方面表示, AI技术的驱动是推进“新芽”业务增长的重要因素。广告技术平台升级后,为所有广告主提供以腾讯混元大模型为基底的一站式人工智能广告创意平台,提升了腾讯广告业务的推荐精准度和投放效率。论营收同比增长,网络广告是腾讯三个主要业务中最高的。
- 北京商报
两小时“吼出”121次AI,谷歌背后埋伏着Open AI的幽灵
“谷歌最坚固的护城河是分销,Gemini 不必成为最好的模型,也能成为世界上最常用的模型。”英伟达高级研究科学家范麟熙(Jim Fan)在X上评价。
不再领先的谷歌,只好握紧生态的优势牌。
- 雪豹财经社
大模型一体机是在“卖盒子”吗?
大模型不同于传统的软件技术,其训练和推理都会涉及大量重要隐私数据,又存在“幻觉”问题,对数据监管和内容安全的担忧并非杞人忧天。
而大模型一体机的本地私有化部署,可以帮助企业实现数据隔离与网络隔离,减少数据传输及存储的风险,确保数据资产的安全性。不打消客观存在的安全顾虑,大模型是很难落地到“最后一公里”的。
所以,大模型一体机并不等于传统的“卖盒子”,而是从复杂产业实际出发的一种选择。
- 脑极体
车载GPT爆红前夜:一场巨头竞逐的游戏
总体上,面对激烈的市场竞争,本土车企不能放过任何一个风口,大模型这种超级大的风口绝对不能错过,其他车企今年会陆续传来大模型上车的消息,这一点基本上毋庸置疑。
接下来这一年,大家可能需要做好迎接各种车载大模型炫技的测评视频满天飞的准备,不过,也不用太理会他们说的怎么天花乱坠,大模型从“能用”到真正“好用”,再到产生破圈效应,诸位且耐心等一等吧。
- HiEV大蒜粒车研所
用户观点
OpenAI联合创始人兼首席科学家Ilya Sutskever宣布离职
- 观点 1:人才注定是孤独的
- 观点 2:这一天终于还是来了
- 观点 3:董事会内讧 最后Sam Altman又回归 注定了当时被认为是领头的Ilya的结局是离开openAI 不过是间隔多久而已
- 观点 4:干得不开心了,委屈了
- 观点 5:Ilya Sutskever 是AI技术大拿是真正的 ChatGPT 之父, 奥特曼是做管理的是拉投资的
- 观点 6:快进到OpenAI失控,天网行动开始
- 观点 7:agi方向发生分歧
微软将中国AI团队集体打包去美国,涉及数百人
- 观点 1:劣币驱逐良币,遵守劳动法的外企都自愿或者被迫撤出了,剩下的都是擅长996和PUA的企业
- 观点 2:首先强制调动就是违反劳动法
- 观点 3:被动润,厉害啊
- 观点 4:有能力才能润,不然就是裁员
- 观点 5:那不爽死了
- 观点 6:微软的AI团队在中国大陆确实很尴尬,政策要求大模型要备案要在国内才能合规,美国又限制中国大陆访问美国训练AI的基础设施,不管怎么看把团队搬走是唯一的选择。
- 观点 7:其实是一样的,如果是中国的大模型发展得比较厉害,要去美国落地的话同样会面临美国政府的各种审查,参考TikTok被要求数据管理隔离和数据存储本地化。
- 观点 8:脱钩断链了
- 观点 9:十年前的话,毫不犹豫就去了,现在的话真不好说。这些人工资这么高,肯定是在国内更舒服。去了工资不一定能涨多少。
- 观点 10:China AI out 策略的一部分
- 观点 11:我觉得是变相裁员
- 观点 12:台积电过去的完全可以跳槽去INTER啊,并且绝对工资翻几倍,你自己不跳怪谁,如果你选择跳INTER那边张开双手欢迎你
前端第一可视化库、百度知名开源项目——ECharts创始人“下海”养鱼
- 观点 1:技术下乡
- 观点 2:牛逼的人做啥都牛逼
- 观点 3:真诚羡慕,可以有多种谋生方法
- 观点 4:羡慕啥?被毕业了没法再这个行业找到下家了,都是嫌弃年纪大了。唉........
- 观点 5:不要以己度人,以我的观察。1. 他从百度离职早几年的事了,那会Echarts还是3.x吧,后来托管Apache到5.0重构又重新走回正轨,只要他愿意依然可以在开源社区中贡献和获得收入。2. 农业创投也是前几年风头了,现在已经进入落地产出的阶段,可能给他带来退出机会和长期主业收入。
- 观点 6:创造虚拟世界,再生物理世界。从虚拟经济到实体经济的跨平台,跨领域,跨学科,跨行业的跨越式转型成功典范
- 观点 7:就光养鱼吗?确定没有用大数据、AI 人工智能、元宇宙、中台、达摩院、云计算、区块链、物联网?
- 观点 8:好像这个品牌背后是马云。这就不奇怪了啊,这就不奇怪了
---END---
最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!