GitHub 发布了 2023 年度 Octoverse 开源状态报告。主要研究了围绕 AI、云和 Git 的开源活动如何改变开发人员体验,以及如何在开发者和企业中产生越来越大的影响。
报告发现了三大趋势:
- 开发人员正在大量使用生成式 AI 进行构建。越来越多的开发人员尝试使用 OpenAI 和其他 AI 公司的基础模型,开源生成式 AI 项目甚至在 2023 年进入了按贡献者数量排名的十大最受欢迎的开源项目。几乎所有开发人员 (92%) 都在使用或尝试借助 AI 编码工具。
- 开发人员正在大规模运行云原生应用程序。使用基于 Git 的基础设施即代码 (IaC) 工作流的声明式语言越来越多,云部署的标准化程度更高,开发人员使用 Dockerfile 和容器、IaC 以及其他云原生技术的速度也急剧加快。
- 2023 年 first-time 开源贡献者数量最多。其中,有商业支持的开源项目依旧最受贡献者欢迎。但生成式 AI 项目在今年进入了 first-time 贡献者最受欢迎的的十大项目之列。GitHub 上的私人项目显着增长,同比增长 38%,占 GitHub 上所有活动的 80% 以上。
全球开发者社区继续增长。美国拥有 2020 万开发者,开发者人数在去年增长了 21%,仍然是全球最大的开发者社区。亚太地区、非洲、南美洲和欧洲的开发者社区规模逐年扩大,其中印度、巴西和日本处于领先地位。
预计到 2027 年,印度将取代美国成为 GitHub 上最大的开发者社区。新加坡今年是亚太地区开发者人数增长最快的国家,并且是开发者占总人口的比例最高的第地区(全球范围内)。报告指出,由于日本在技术和初创企业方面的进一步投资,明年日本的开发者将有持续增长。
生成式 AI 在 2023 年经历了爆发式增长,仅半年内涌现出的生成式 AI 项目数量就已达到了 2022 年全年的两倍之多。开发人员也开始更多地尝试使用 AI 模型。前几年,开发人员常使用 tensorflow/tensorflow、pytorch/pytorch 等机器学习库构建项目;现在则更多尝试使用 AI 模型和 LLM(如 ChatGPT API)。
报告分析了 GitHub 上排名前 20 位的开源生成式 AI 项目,发现其中一些顶级项目都是由个人所有。生成式 AI 项目中的个人贡献者正在全球范围内大幅飙升,同比增长幅度达到了 148%,而生成式 AI 项目总数也同比增长 248%。
美国、印度和日本在开发者社区中处于领先地位,香港特别行政区、英国和巴西紧随其后。
最流行的编程语言
报告指出,自 2019 年云原生开发大规模增长以来,IaC 在开源领域持续增长。2023年,Shell 和 Hashicorp配置语言(HCL)再次成为开源项目中的顶级语言,HCL 采用率同比增长 36%;“表明运维和 IaC 工作在开源领域越来越受到重视”。
- JavaScript 仍然是 GitHub 上最常用的语言,其次是 Python。
- TypeScript 越来越受欢迎,首次取代 Java 成为 GitHub 上 OSS 项目中第三大最受欢迎的语言,其用户群增长了 37%。
- 用于数据分析和操作的流行语言和框架明显增加。T-SQL 和 TeX 等古老的语言在 2023 年均有所增长,凸显了数据科学家、数学家和分析师越来越多地使用开源平台和工具。“编程语言不再仅仅局限于传统软件开发领域”。
- 在 GitHub 上一些较新的项目中,Kotlin、Rust、Go 和 Lua 的采用出现了较大的增长。“Rust 和 Lua 都以内存安全和高效著称,而且都可用于系统和嵌入式系统编程,这也是它们增长的原因。而 Go 最近的增长则是由 Kubernetes 和 Prometheus 等云原生项目的推动。”
其他一些发现还包括:
- 与 2022 年相比,2023 年开源代码开发人员合并的针对易受攻击软件包的自动 Dependabot 拉取请求增加了 60%
- 2023 年,开发者为 GitHub 上的开源项目做出了 3.01 亿次贡献,这些项目既有像 Mastodon 这样的热门项目,也有像 Stable Diffusion 和 LangChain 这样的生成式 AI 项目。
- 2023 年有 430 万个存储库使用了 Docker。Linux 发行版 NixOS/nixpkgs 在过去两年中一直位居开源项目贡献者榜首。
更多详情可查看完整报告。