Google I/O 变 Google A/I ,力压 GPT4o

2024年 5月 16日 72.5k 0

Google I/O 变 Google A/I ,力压 GPT-4o-1

21CTO导读:今年的 Google I/O 开发者大会应该改名,它已经将重点关注到人工智能。但是新的互联网生态系统对人工智能与谷歌搜索的担忧却似乎没有答案。

Google 一年一度的开发者大会仍然被称为 Google I/O,不过2024年应该叫 Google A/I 大会可能更加合适。

这是因为,这个从周二开始的大会中,几乎所有面向开发者的公告都提到了人工智能,它变成了一个通用的术语,被用来描述从文本成成到图像识别以及语言翻译的全部内容。

Google I/O 变 Google A/I ,力压 GPT-4o-2

虽然被OpenAI抢了风头,这家互联网与软件巨头还是推出一系列让开发者眼前一亮的新产品与技术。

新的 Gemini 1.5 发布

面对OpenAI等公司的竞争,Google 继续增强其旗下所有的 AI 模型,Gemini 1.5 Pro在 200 多个国家/地区全面进入公开预览版,同时又推出了名为 Gemini 1.5 Flash 的速度调整新变体。

这两种模型都具有 100 万个令牌上下文窗口,这表示它们可以接受大量数据作为输入,并且它们都通过 Google AI Studio 向参与私人预览的开发者提供 200 万个令牌上下文窗口。

Gemini API 目前可以处理并行函数调用与本机视频帧提取,很快它将支持上下文缓存,还可以通过存储常用的上下文数据来帮助管理运行成本。

Google 的开放模型系列 Gemma 正在通过新的姊妹产品进行扩展。包括除了用于代码完成和生成的CodeGemma,还有用于更好内存使用的 RecurrentGemma,现在还出来一个用于多模式视觉语言任务的 PaliGemma。

此外,Google 还计划展示即将在 6 月推出的 Gemma 2 系列机型。该集合的第一个成员将是一个 270 亿个参数的大语言模型。

Google 实验室副总裁 Josh Woodward  向人们解释道:“它经过优化,可在 Nvidia 的下一代 GPU 或 Vertex AI 中的单个 TPU 主机上运行。这就是它易于使用的原因。而且人们也已经看到了一些出色的品质,它性能优于现有型号的2倍。”

Android 深度结合 AI

Android Studio 中的 Gemini最初以 StudioBot 的名称开始,今年也在合适时机进行了改造,它使用 Gemini 1.5 Pro 处理多模式输入。

Android 开发者副总裁 Matthew McCullough 介绍说:“Android 将是一款以人工智能为核心的操作系统。我们正在帮助开发者打造只有人工智能才能解锁的,一种令人难以置信的体验,然后将这些体验完整交付到用户手中。”

McCullough 说,Google在为开发者提供多个将 AI 集成到 Android 应用中的方法,包括 Google AI Client SDK 和 Vertex AI SDK,这两种方法都已经出了公开预览版。

McCullough 对Android开发者这样描述:

“如果开发者不熟悉生成式 AI 构建,也没关系,可以先对 AI Studio进行实验以及原型设计,然后再使用 Google AI Client SDK ,将 Gemini 无缝集成到的 Android 应用程序中。如果企业用户已经在使用 Vertex AI,可以使用 Vertex AI SDK 来访问 Gemini 的全部功能。”

Chrome 浏览器全面AI化

Google 今年的一大策略是在 Chrome 浏览器中添加机器学习模型。

特别是 Gemini Nano 模型,这要归功于 WebGPU 和WebAssembly的改进,使人工智能能够在更广泛的计算机硬件上更好地工作。

Google网络平台小组产品管理总监 Jon Dahlke 表示:“从 Chrome 126 开始,Gemini 将内置于 Chrome 桌面客户端中。我们将使用 Gemini 来支持我们自己的人工智能功能,包括帮助写作,它使用设备上的人工智能来帮助用户编写简短的内容,例如产品评论、社交媒体帖子与客户反馈表单。”

Google将使用集成的 Gemini Nano 模型来实现自己基于浏览器的 AI 功能,并通过预览程序向开发者们提供。

Google 已“投入巨资,确保 AI 模型通过使用 WebGPU 和 Wasm(支持网络设备上 AI 的骨干技术)快速高效地运行。”与 Chrome 一起,这种对人工智能工程的平台支持是谷歌可以比其人工智能竞争对手 OpenAI、微软和 Meta 占据优势的领域之一。

Google I/O 变 Google A/I ,力压 GPT-4o-3

“我们的愿景是,开发者将能够为 Chrome 的数十亿用户提供强大的人工智能解决方案,而不必担心提示语工程、微调、容量或成本等,你们所要做的就是调用一些高级 API,例如翻译、字幕或转录等功能。”

并且其它浏览器厂商会相继采取类似的步骤。Google已经“开始与其它浏览器合作”,这意味着浏览器中人工智能模型的Web标准开始出现。

在媒体询问 Gemini Nano 是否会配备新的投诉功能,以便向Google通报模型错误或滥用情况。媒体活动结束后,其发言人回复道:“安全是我们模型开发与部署不可或缺的一部分。Gemini Nano 集成是根据Google与SAIF和 Responsible AI 实践合作构建的。”

值得一提的是,该声明并未明确 Chrome 是否会发出更新颖的遥测数据来监视大模型滥用。

Chrome 的人工智能注入也渗透到了 Chrome DevTools Console,得益于 Gemini Nano,控制台将看到错误解释和调试解决方案。这项被称为 Console Insights 的功能,最早将于下周将在美国地区作为实验性功能提供,之后成熟后应该会推广到其它国家/地区。

人工智能应用开发环境 Project IDX

其基于云的集成开发环境Project IDX,现已结束公共预览版并进入测试阶段。它可以帮助我们开发用于人工智能驱动的应用程序。

Project IDX 适合那些想要构建可在Web和各种移动操作系统上运行的应用程序的开发人员。它与 GitHub Codespaces 有几许相似之处,因为这两个产品都与 Microsoft 的开源 Visual Studio Code 产品 Code OSS 集成。

但 IDX的特点“更加固执己见”。举一个例子,它能够进行 Android 模拟和 iOS 模拟。

关于 Project IDX 获得了更多人工智能功能。Google表示说:“我们已将 Gemini 模型深入集成到 IDX 中,以便直接在你的工作空间中提供更大的帮助。”

Google I/O 变 Google A/I ,力压 GPT-4o-4

IDX 项目中的人工智能助手

Project IDX 已经支持人工智能驱动的代码完成、辅助聊天以及“添加注释”和“解释此代码”等上下文代码操作。

在 I/O 大会上,开发者们又被告知这些功能已得到“进一步改进”。

在有人询问 Google 的开发者产品是可以帮助网页设计流程,例如创建 CSS 和布局。这些以设计为中心的人工智能功能现在在Figma和Locofy等工具中已经很常见。

Google开发副总裁兼总经理 Jeanine Banks 回答道:

“我们计划今年推出更多转换功能和代码修复,我认为另一个重要的事情是与设计的联系。那么设计工作流程如何转化为代码呢?这也是我们正在关注的一个空间。”

Flutter与Python团队被裁撤之后

估计大家特别关心Flutter和Python团队。

在两个团队裁员之后,没有特别大的影响。“巧克力工厂”的 Dart 编程语言和 Flutter 跨平台开发框架分别升级到 3.4 和 3.22 。

最显著的变化包括 Flutter Web 应用程序中对 WebAssembly 的本机支持,据称在大多数情况下可以将帧渲染时间提高2倍。在 Dart 中,更新添加了宏,这可能对于自动化 Flutter 开发工作流程很有用。

Firebase 服务

如果没有宣布某种新框架,这就不会是一次开发者大会。

果不其然,Google 推出 Firebase Genkit——一个为 JavaScript/TypeScript 开发人员构建的新开源框架,很快将支持 Go 语言的版本即将推出,帮助他们为 AI 应用程序创建 Node.js 后端。

不过,我们也不必非得使用 Firebase。Google 指出,如果使用 VS Code 或 Project IDX,“你还可以在 VS Code 集成浏览器中打开 Genkit Developer UI,并将其与你的代码并排使用。”

Genkit 支持数据源、大模型、云服务与代码的集成:

  • 大型语言模型,例如 Google 的 Gemini 和 Ollama 的开源模型。

  • 矢量数据库,例如 Chroma、Pinecone、Cloud Firestore 和 PostgreSQL (pgvector)。

  • 来自 Google 的嵌入服务(Google AI 和 Vertex)。

其它重要增强

此外,推测规则 API(通过在后台预取和预渲染页面来促进更快的页面加载)也已经融入了人工智能。Google 介绍说,人工智能可以通过预测导航模式来进一步优化,以提高资源预加载的效率。

在将人工智能融入一切之后,Google还向 Android 和 iOS 开发者提供 Checks 服务。Checks 使用人工智能来验证应用程序(无论是否支持人工智能)是否符合隐私和数据收集要求。

除了网络平台的新增功能之外,谷歌还宣布了对整个开发板的一系列其他调整,例如 Angular 中的部分水合、Maps JavaScript API 中的 3D 沉浸式体验以及其移动平台 Flutter 和 Dart 的新版本。

未提及搜索对网络生态系统的影响

尽管在 Google I/O 大会上宣布了大量人工智能功能,但这家巨头没有提及人工智能搜索对互联网平台的影响。

虽然搜索引擎不是开发者大会的重点,但今年人们对Google将如何防御人工智能增强的微软 Bing、Perplexity以及来自 OpenAI这样的新进入者,甚至可能是“搜索 GPT”的攻击,捍卫自己的搜索引擎领域越来越感兴趣。

有开发者提出,所在的公司的网站或Web应用程序可能会受到人工智能驱动的搜索威胁。但是,Google I/O 大会并没有提到人工智能对网络的生存威胁。

鉴于网络生态系统在一段时间内仍会充满生机,开发者再有一堆闪亮的新人工智能工具还是有很多好处。

作者:万能的大雄

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论