开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有

2024年 7月 12日 40.3k 0

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.12

今日要闻

Facebook 开源 C++ 框架 Ocean:用于计算机视觉和增强现实

Ocean 是 Facebook 内部用于计算机视觉 (CV) 和增强现实 (AR) 应用程序开发的开源 C++ 框架。

Ocean 主要使用 C++ 编写,且不依赖于特定平台,用于执行各种任务,包括计算机视觉、几何、媒体处理、网络和渲染。

开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有-1

蚂蚁集团开源 EchoMimic:支持为人像照片对口型、生成肖像动画视频

EchoMimic 具备较高的稳定性和自然度,通过融合音频和面部标志点(面部关键特征和结构,通常位于眼、鼻、嘴等位置)的特征,可生成更符合真实面部运动和表情变化的视频。其支持单独使用音频或面部标志点生成肖像视频,也支持将音频和人像照片相结合做出 “对口型” 一般的效果。

开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有-2

英伟达开源混合 Mamba-Transformer 视觉骨干架构

英伟达公开了MambaVision 的 PyTorch 实现:混合 Mamba-Transformer 视觉骨干。MambaVision 采用分层架构,同时使用自关注(self-attention)和混合模块。

视觉骨干架构(Vision backbone)是视觉网络中用来提取特征的部分,在获取分析内容后,利用提取的特征完成各种任务,比如图像分割、目标检测等。

程序员起诉微软、GitHub 和 OpenAI有了后续:法官驳回大部分索赔要求

2022 年 11 月,一群程序员对微软、GitHub 和 OpenAI 提起集体诉讼,指控 GitHub Copilot 违反版权法,在没有适当归属或遵守开源许可的情况下使用了他们的代码。在当时,这被视为可能改变生成式 AI 行业游戏规则的事件,但后来情况发生了变化。

7 月 5 日,法官 Jon Tigar 对原告的又一批索赔做出了裁决。总体而言,GitHub、微软和 OpenAI 都取得了胜利。三项诉索赔要求被驳回,只有一项获准继续审理。根据微软和 GitHub 律师的统计,目前总共只剩下两项指控。

今日观察

社交观察

奔跑了五年,就为做一件难而正确的事,继续奔跑!

五年前的今天,我做了一艰难的决定,将开发了两年多的时序大数据处理平台TDengine的核心代码全部开源。没想到的是,TDengine 开源后迅速引起了开发者的高度关注,在GitHub全球趋势排行榜上多次排名第一。截止到今天,TDengine在GitHub上的Star已经超过23k, Fork数超过4.8k, 在全球检测到的安装实例数超过56万,遍布全球60多个国家和地区。

这些数字让我这个年过50但仍然冲在coding第一线的老程序员兴奋不已,因为有人Star、有人用,它说明我们没日没夜开发的代码,给大家带来了价值。海量的用户群,是对一个程序员工作的最大回报。今天借开源五周年之际,回顾一下TDengine的整个发展旅程,与众多的开发者和创业者分享。

- 微信 爱倒腾的程序员

低成本的开源 AI 智能眼镜

一款开源的低成本的 AI 智能眼镜,成本仅需 25 美元(国内的替代品物料可以做到百元左右),就可以将普通的眼镜升级成 AI 智能眼镜。它支持录制视频、识别物体和翻译文本等功能,但需要与电脑配合使用,暂不支持在镜片上显示内容。

开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有-3

GitHub:github.com/BasedHardware/OpenGlass

- 微博 
林亦LYi

类似 ChatGPT 且适用于苹果设备的客户端

Enchanted 是一个开源的、兼容 Ollama 的优雅 macOS/iOS/visionOS 应用程序,适用于使用 Llama 2、Mistral、Vicuna、Starling 等私有托管模型。它本质上是一个 ChatGPT 应用界面,可以连接到您的私有模型。Enchanted 的目标是提供一个产品,能够在 iOS 生态系统(包括 macOS、iOS、Watch 和 Vision Pro)中,实现无过滤、安全、私密和多模态的使用体验。

项目地址:github.com/AugustDev/enchanted

- 微博 宝玉xp

多模态 Agent 框架 - OmAgent 开源

OmAgent是一个多模态智能体系统,专注于利用多模态大语言模型能力以及其他多模态算法来做一些有趣的事。OmAgent项目包含一个专为解决多模态任务而设计的轻量级智能体框架omagent_core。项目利用这个框架搭建了超长复杂视频理解系统——OmAgent,当然你可以利用它实现你的任何想法。

项目:github.com/om-ai-lab/OmAgent/blob/main/README_ZH.md
论文:arxiv.org/abs/2406.16620

- 微博 黄建同学

媒体观察

智能汽车亟待系好网络“安全带”

自动驾驶技术产业化进程正在加速。作为人工智能赋能汽车业的典型应用场景,自动驾驶既是汽车业变革的明确方向,又是数字经济与实体经济深度融合的新赛道,也是发展新质生产力的重要领域。在惊叹“自动驾驶已经进化到这种程度”的同时,更应关注的是自动驾驶技术的安全性,是我国“车路云一体化”技术路线带来的产业机会。

- 经济参考报

谁才是大模型“四小龙”?

有一种说法是,智谱AI、月之暗面、百川智能、面壁智能,这四家公司是新的“四小龙”,在6月中旬举办的2024智源大会上,四位CEO首次同台,“四小龙”的说法就传开了。

还有人说中国有“大模型五虎”:百川智能、智谱AI、月之暗面、MiniMax、云从科技。这里边把面壁智能剔除了。

- 定焦

专访北京超算:国产芯片15天左右可跑通大模型,高端算力仍需各方努力

算力与数据,是支撑超大规模训练模型发展的两大基础设施。面对全球追逐大模型热潮,高端AI芯片短缺,算力问题也成为各行业实现人工智能普惠的最大难点。

- 红星资本局

AI算力价格调查:价格回归下的供需平衡术

需求高企的同时,行业也在阶段性发生变化。从国内市场来看,今年以来,随着国内对算力供需关系平衡的预期,部分算力价格开始松动。一方面,有供应链的消息称,英伟达为了吸引客户,将H20单卡价格从12.5万下降至10万左右;另一方面,从AI服务器角度来看,当前也存在一定的价格回调。

- 21世纪经济报道

大模型玩具,AI硬件的第一个突破口

在硬件中搭载大模型的思路,并不难想到,几乎所有的教育公司都会在产品中注入AI,尤其是“双减”后,面向义务教育阶段的学科培训受限,教育硬件成为行业玩家掘金的重点。学习机、词典笔、甚至是早教机、故事机、单词卡等小品类硬件都成为各家发力的对象,内容之外,AI就是其最大卖点。

- 界面

苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有

CUDA成功的一个因素是他们拥有一支内部研究团队,这支团队使用CUDA做一些创新。有时将这些创新转化为产品(如OptiX),更多地是为了展示硬件能力以及提供实现方法……

不知道AMD对这次收购有何打算,但可以看到拥有一个内部的大模型团队为客户创建模型、进行基准测试并改进产品可能带来很大的价值。

- 参考消息网

今日推荐

开源项目

mojolicious/mojo.js

开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有-4

https://github.com/mojolicious/mojo.js

mojo.js 是 Node.js 实时 Web 框架,可将它视作采用 TypeScript 重写的 Mojolicious。mojo.js 使用了所有最新的 JavaScript 特性,专为聚焦超媒体 (hypermedia) 的后端 Web 服务精心设计。

每日一博

探讨打造「高可用架构」秘籍

高可用性的文章多如牛毛,看得人眼花缭乱。今天,咱们换个花样,以终为始,来聊聊如何实现系统业务的高可用性这个宏伟目标。本文覆盖高可用架构设计、常见架构模式、高可用开发运维、大促高可用保障、业务高可用、COE 复盘等方面的理念和思考。

开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有-5

开源之声

用户观点

JetBrains IDE全系列采用新的默认“皮肤”:即将面向所有用户提供

  • 观点 1:能不能把内存占用改改,净整些花里胡哨的
    • 观点 2:他用java内存占用再优化也好不到哪去
  • 观点 3:越来越像vs code
    • 观点 4:应该说是vscode设计的确实好
  • 观点 5:和现在的2024.1看不出任何区别
    • 观点 6:就是默认开启新UI了而已。。原本是默认不开启的。
  • 观点 7:赶紧把clione nova搞好合并进clion 这才是正事。fleet还没有正式版啊 还要多久
    • 观点 8:不是已经合了吗?还有nova吗?
  • 观点 9:还是喜欢 Material ui
  • 观点 10:用了几天,还是不习惯
  • 观点 11:rider 开大项目比 vs 还要卡,我以为 vs 的设计器已经够卡了,rider 比他还卡,不过看在 rider 代码补全机制比较优秀还是忍忍
  • 观点 12:能不能便宜点
  • 观点 13:我都用了1、2年新UI了,特别棒!比经典的UI清爽多了!很喜欢!
  • 观点 14:不知道什么时候visual studio也能跟上,idea这个模式开小窗口的时候很友好
  • 观点 15:Fira code字体在新ui里显示不太正常 字符间距格外的小
  • 观点 16:新UI我倒是挺喜欢,新终端做的不好,用起来很卡
  • 观点 17:降低了视觉复杂性,增高了操作复杂性。

VidHub播放器禁止播放版权受保护的视频

  • 观点 1:我觉得应该备案过的视频才能被播放
  • 观点 2:逼着每个程序员自己写一个的节奏
  • 观点 3:保护过头,属于是溺爱了
  • 观点 4:看了消息说今天更新了版本去掉了这个版权检测
  • 观点 5:退款!

Spring Framework 6.1.11 发布

  • 观点 1:想当年,第一次用的时候,就一个spring.jar
  • 观点 2:Spring 6都出来了,我们公司还在用Spring 3

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!

开源日报 | FB开源C++框架Ocean;程序员起诉GitHub后续;开源AI智能眼镜;大模型“四小龙”;英伟达有的AMD也要有-6 

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论