深入理解Babel 项目管理工具Lerna解析

开发运维 2024-05-30 Escape 手机阅读

一、背景

Babel是一个比较庞大的项目，其子工程就有至少140个(如 babel/plugins/presets/lerna/babel-loader等)，产出的子工具已经是前端开发的基础设施，对开发效率、代码质量等有非常高的要求。

在本文中，我们将了解Babel是怎样进行项目管理的。

深入理解Babel 项目管理工具Lerna解析-每日运维网图片

本文从工程管理、代码管理、文档管理、质量管理四个方面对Babel项目管理进行拆解分析。

工程管理

Babel是典型的monorepo项目，即单仓库项目，所有的子模块在同一个仓库里。Babel目前有140+个子模块，在工程管理部分，需要解决以下问题：

模块间如何方便地互相关联进行本地开发；
整个项目的版本控制；
操作自动化。

工程管理部分主要使用lerna、yarn等工具。

代码风格

Babel是多人协作开发的开源项目，如何保证代码风格一致，Babel使用的是社区常见的解决方案。

该模块主要使用eslint、prettier等工具。

文档

Babel的迭代速度很快、涉及的模块很多，该模块解决版本发布后如何自动更新相关文档等问题。

该模块主要使用lerna等工具。

质量控制

Babel的产品是前端开发的基础设施，该模块主要保证Babel的产出是高质量的。

该模块主要使用jest、git blame等工具。

二、monorepo

Babel使用monorepo模式进行工程管理。

什么是monorepo

monorepo(monolithic repository)，指的是单仓库代码，将多个项目代码存储在一个仓库里。另外有一种模式是multirepo，指的是多仓库代码(one-repository-per-module)，不同的项目分布在不同的仓库里。React、Babel、Jest、Vue、Angular均采用monorepo进行项目管理。

典型的monorepo结构是：

├── packages
|   ├── pkg1
|   |   ├── package.json
|   ├── pkg2
|   |   ├── package.json
├── package.json

这是Babel源码的目录结构：

├─ lerna.json
├─ package.json
└─ packages/ # 这里将存放所有子项目目录
    ├─ README.md
    ├─ babel-cli
    ├─ babel-code-frame
    ├─ babel-compat-data
    ├─ babel-core
    ├─ babel-generator
    ├─ babel-helper-annotate-as-pure
    ├─ babel-helper-builder-binary-assignment-operator-visitor
    ├─ babel-helper-builder-react-jsx
    ├─ ...

而rollup则采取了multirepo的模式：

├─ rollup
    ├─ package.json
    ├─ ...
├─ plugins
    ├─ package.json
    ├─ ...
├─ awesome
    ├─ package.json
    ├─ ...
├─ rollup-starter-lib
    ├─ package.json
    ├─ ...
├─ rollup-plugin-babel
    ├─ package.json
    ├─ ...
├─ rollup-plugin-commonjs
    ├─ package.json
    ├─ ...

monorepo的优缺点

优点

便捷的代码复用与依赖管理当所有项目代码都在一个工程里，抽离可复用的代码就十分容易了。并且抽离后，如果复用的代码有改动，可以通过一些工具，快速定位受影响的子工程，进而做到子工程的版本控制。
便捷的代码重构通过一些工具，monorepo项目中的代码改动可以快速地定位出代码变更的影响范围，对整个工程进行快速的整体测试。而如果子工程分散在不同的工程分支里的话，通用代码的重构将难以触达各个子工程。
倡导开放、共享monorepo项目中，开发者可以方便地看到所有子工程，这样响应了"开放、共享"的组织文化。可以激发开发者对工程质量等维护的热情（毕竟别人看不到自己的代码，乱不乱就看自己心情了），有助于团队建立良好的技术氛围。

缺点

复杂的权限管理因为所有子工程集中在一个工程里，某些子工程如果不希望对外展示的话，monorepo的权限管理就比较难以实现了，难以锁定目标工程做独立的代码权限管理。
较高的熟悉成本相对于multirepo，monorepo涉及各种子工程、通用依赖等，新的开发者在理解整个项目时，可能需要了解较多的信息才能入手，如通用依赖代码、各子工程功能。
较大的工程体积很明显，所有子工程集成在一个工程里，代码体积会非常大，对文件存储系统等提出了较高的要求。
较高的质量风险成也萧何败萧何，monorepo提供了便捷的代码复用能力，同时，一个公用模块的某个版本有bug的话，很容易影响所有用到它的子工程。此时，做好高覆盖率的单元测试就比较重要了。

选择

multirepo和monorepo是两种不同的理念。

multirepo允许多元化发展，每个模块独立实现自己的构建、单元测试、依赖管理等。monorepo抹平了模块间的很多差异，通过集中管理和高度集成化的工具，减少开发和沟通时的成本。monorepo最大的问题可能就是不能管理占用空间太大的项目了。

所以，还是要根据项目的实际需求出发选择用哪种项目管理模式。

三、lerna

lerna是基于git/npm/yarn等的工作流提效工具，用于维护monorepo。它是Babel 开发过程中提升开发效率产出的工具。

lerna本身也是一个monorepo的项目，并且，lerna为monorepo项目提供了如下支持:

项目管理

lerna提供了一系列命令用于monorepo项目初始化、添加子项目、查看项目信息等。

依赖管理

lerna支持为monorepo项目统一管理公共依赖、自动安装各个子项目的依赖、自动创建子模块符号链接等。

版本管理

lerna可以根据项目代码的变动情况，发现影响的子项目范围，在发布时提供语义化版本推荐等，极大提升了monorepo项目的版本管理效率。

lerna命令集

命令行列表

lerna官网有对各种命令各种用法的详细介绍，这些命令可以分为：项目管理、依赖管理、版本管理三大类。

深入理解Babel 项目管理工具Lerna解析-每日运维网图片

全局配置项

lerna有一批通用参数，所有子命令均可以使用。

--concurrency

当lerna将任务并行执行时，需要使用多少线程(默认为逻辑CPU内核数)。

lerna publish --concurrency 1

--loglevel

要报告什么级别的日志。如果失败，所有日志都写到当前工作目录中的lerna-debug.log中。

任何高于该设置的日志都会显示出来。默认值是"info"。

--max-buffer

为每个底层进程调用设置的最大缓冲区长度。例如，当有人希望在运行lerna import的同时导入包含大量提交的仓库时，就是它出场的时候了。在这种情况下，内置的缓冲区长度可能不够。

--no-progress

禁用进度条。在CLI环境中总是这样。

--no-sort

默认情况下，所有任务都按照拓扑排序的顺序在包上执行，以尊重所讨论的包的依赖关系。在不保证lerna调用一致的情况下，以最努力的方式打破循环。

如果只有少量的包有许多依赖项，或者某些包执行的时间长得不成比例，拓扑排序可能会导致并发瓶颈。--no-sort配置项禁用排序，而是以最大并发的任意顺序执行任务。

如果您运行多个watch命令，该配置项也会有所帮助。因为lerna run将按照拓扑排序的顺序执行命令，所以在继续执行之前可能会等待某个命令。当您运行"watch"命令时会阻塞执行，因为他们通常不会结束。

--reject-cycles

如果（在bootstrap、exec、publish或run中）发现循环，则立即失败。

lerna bootstrap --reject-cycles

过滤器参数

--scope

只包含名称与给定通配符匹配的包。

lerna exec --scope my-component -- ls -la     
lerna run --scope toolbar-* test     
lerna run --scope package-1 --scope *-2 lint

--ignore

排除名称与给定通配符匹配的包。

lerna exec --ignore package-{1,2,5}  -- ls -la     
lerna run --ignore package-1  test     
lerna run --ignore package-@(1|2) --ignore package-3 lint

--no-private

排除私有的包。默认情况下是包含它们的。

--since [ref]

只包含自指定ref以来已经改变的包。如果没有传递ref，它默认为最近的标记。

# 列出自最新标记以来发生变化的包的内容
    $ lerna exec --since -- ls -la


    # 为自“master”以来所有发生更改的包运行测试
    $ lerna run test --since master


    # 列出自“某个分支”以来发生变化的所有包
    $ lerna ls --since some-branch

在CI中使用时，如果您可以获得PR将要进入的目标分支，那么它将特别有用，因为您可以将其作为--since配置项的ref。这对于进入master和feature分支的PR来说很有效。

--exclude-dependents

当使用--since运行命令时，排除所有传递的被依赖项，覆盖默认的“changed”算法。

如果没有--since该参数时无效的，会抛出错误。

--include-dependents

在运行命令时包括所有传递的被依赖项，无视--scope、--ignore或--since。

--include-dependencies

在运行命令时包括所有传递依赖项，无视--scope、--ignore或--since。

与接受--scope(bootstrap、clean、ls、run、exec)的任何命令组合使用。确保对任何作用域的包（通过--scope或--ignore）的所有依赖项（和dev依赖项）也进行操作。

注意：这将会覆盖--scope和--ignore。

例如，如果一个匹配了--ignore的包被另一个正在引导的包所以来，那么它仍会照常工作。

当您想要“设置”一个依赖于其他正在设置的包其中的一个包时，这是非常有用的。

lerna bootstrap --scope my-component --include-dependencies     
# my-component 及其所有依赖项将被引导

lerna bootstrap --scope "package-*" --ignore "package-util-*" --include-dependencies     
# 所有匹配 "package-util-*" 的包将被忽略，除非它们依赖于名称匹配 "package-*" 的包

--include-merged-tags

lerna exec --since --include-merged-tags -- ls -la

在使用--since命令时，它包含来自合并分支的标记。这只有在从feature分支进行大量发布时才有用，通常情况下不推荐这样做。

lerna原理解析

文件结构

以下是lerna的主要目录结构（省略了一些文件和文件夹）：

lerna
├─ CHANGELOG.md -- 更新日志
├─ README.md -- 文档
├─ commands -- 核心子模块
├─ core -- 核心子模块
├─ utils -- 核心子模块
├─ lerna.json -- lerna 配置文件
├─ package-lock.json -- 依赖声明
├─ package.json -- 依赖声明
├─ scripts -- 内置脚本
└─ yarn.lock -- 依赖声明

有趣的是，lerna本身也是用lerna进行开发管理的。它是一个monorepo项目，其各个子项目分布在lerna/commands/*、core/*、utils/*目录下。

另外，在源码中，经常会看到名称为@lerna/command的子项目，如lerna/core/lerna/index.js的内容是：

const cli = require("@lerna/cli");


const addCmd = require("@lerna/add/command");
const bootstrapCmd = require("@lerna/bootstrap/command");
const changedCmd = require("@lerna/changed/command");
const cleanCmd = require("@lerna/clean/command");
const createCmd = require("@lerna/create/command");
const diffCmd = require("@lerna/diff/command");
const execCmd = require("@lerna/exec/command");
const importCmd = require("@lerna/import/command");
const infoCmd = require("@lerna/info/command");
const initCmd = require("@lerna/init/command");
const linkCmd = require("@lerna/link/command");
const listCmd = require("@lerna/list/command");
const publishCmd = require("@lerna/publish/command");
const runCmd = require("@lerna/run/command");
const versionCmd = require("@lerna/version/command");

这些子项目分布在lerna/commands/*、core/*、utils/*下，截至本文截稿时，lerna有61个子项目。

以下是各子项目分布：

深入理解Babel 项目管理工具Lerna解析-每日运维网图片

命令行注册

lerna命令注册工作集中在lerna/core/lerna/*路径下。

lerna/core/lerna/package.json

该文件的bin字段定义了lerna命令：

"bin": {         
    "lerna": "cli.js"     
}

lerna/core/lerna/cli.js

该文件描述了命令行的执行入口：

#!/usr/bin/env node


    "use strict";


    /* eslint-disable import/no-dynamic-require, global-require */
    const importLocal = require("import-local");


    if (importLocal(__filename)) {
        require("npmlog").info("cli", "using local version of lerna");
    } else {
        require(".")(process.argv.slice(2));
    }

lerna/core/lerna/index.js

该文件为命令行引入了所有lerna指令：

"use strict";


const cli = require("@lerna/cli");


const addCmd = require("@lerna/add/command");
const bootstrapCmd = require("@lerna/bootstrap/command");
const changedCmd = require("@lerna/changed/command");
const cleanCmd = require("@lerna/clean/command");
const createCmd = require("@lerna/create/command");
const diffCmd = require("@lerna/diff/command");
const execCmd = require("@lerna/exec/command");
const importCmd = require("@lerna/import/command");
const infoCmd = require("@lerna/info/command");
const initCmd = require("@lerna/init/command");
const linkCmd = require("@lerna/link/command");
const listCmd = require("@lerna/list/command");
const publishCmd = require("@lerna/publish/command");
const runCmd = require("@lerna/run/command");
const versionCmd = require("@lerna/version/command");


const pkg = require("./package.json");


module.exports = main;


function main(argv) {
const context = {
    lernaVersion: pkg.version,
};


return cli()
    .command(addCmd)
    .command(bootstrapCmd)
    .command(changedCmd)
    .command(cleanCmd)
    .command(createCmd)
    .command(diffCmd)
    .command(execCmd)
    .command(importCmd)
    .command(infoCmd)
    .command(initCmd)
    .command(linkCmd)
    .command(listCmd)
    .command(publishCmd)
    .command(runCmd)
    .command(versionCmd)
    .parse(argv, context);
}

Commander类

lerna的子命令均继承自Command类，比如lerna init命令定义为：

const { Command } = require("@lerna/command");


class InitCommand extends Command {
    ...
}

Command类定义在@lerna/command，位于lerna/core/command目录。

有一些写法值得借鉴，比如个别方法需要InitCommand的实例自行定义，否则抛错，InitCommand类的定义如下：

class InitCommand extends Command {
    ...


    initialize() {
        throw new ValidationError(this.name, "initialize() needs to be implemented.");
    }


    execute() {
        throw new ValidationError(this.name, "execute() needs to be implemented.");
    }
}

import-local

上文提到，lerna/core/lerna/cli.js描述了命令行的执行入口：

#!/usr/bin/env node


"use strict";


/* eslint-disable import/no-dynamic-require, global-require */
const importLocal = require("import-local");


if (importLocal(__filename)) {
    require("npmlog").info("cli", "using local version of lerna");
} else {
    require(".")(process.argv.slice(2));
}

其中，import-local的作用是，实现本地开发版本和生产版本的切换。import-local/index.js的内容是：

'use strict';
const path = require('path');
const resolveCwd = require('resolve-cwd');
const pkgDir = require('pkg-dir');


module.exports = filename => {
    const globalDir = pkgDir.sync(path.dirname(filename));
    const relativePath = path.relative(globalDir, filename);
    const pkg = require(path.join(globalDir, 'package.json'));
    const localFile = resolveCwd.silent(path.join(pkg.name, relativePath));
    const localNodeModules = path.join(process.cwd(), 'node_modules');
    const filenameInLocalNodeModules = !path.relative(localNodeModules, filename).startsWith('..');


    // Use path.relative() to detect local package installation,
    // because __filename's case is inconsistent on Windows
    // Can use === when targeting Node.js 8
    // See https://github.com/nodejs/node/issues/6624
    return !filenameInLocalNodeModules && localFile && path.relative(localFile, filename) !== '' && require(localFile);
};

依赖管理

Babel使用lerna进行依赖管理。其中，lerna自己实现了一套依赖管理机制，也支持基于yarn的依赖管理。这里主要介绍lerna的hoisting。

子模块相同的依赖可以通过依赖提升（hoisting），将相同的依赖安装在根目录下，本地包之间用软连接实现。

lerna bootstrap

该命令执行时，会在每个子项目下面，各自安装其中package.json声明的依赖。

这样会有一个问题，相同的依赖会被重复安装，除了占用更多空间外，依赖安装速度也受影响。

lerna bootstrap --hoist

--hoist标记时，lerna bootstrap会识别子项目下名称和版本号相同的依赖，并将其安装在根目录的node_modules下，子项目的node_modules会生成软连接。

这样节省了空间，也减少了依赖安装的耗时。

yarn install

当在项目中声明yarn作为依赖安装的底层依赖，如：

lerna.json

{             
    "npmClient": "yarn",             
    "useWorkspaces": true,         
}

package.json

{             
    "workspaces": [                 
        "packages/*"             
    ]         
}

相对于lerna，yarn提供了更强大的依赖分析能力、hoisting算法。而且，默认情况下，yarn会开启hoist功能，也可以设置nohoist关闭该功能：

{             
    "workspaces": {                 
        "packages": [                     
            "Packages/*",                 
        ],                 
        "nohoist": [                     
            "**"                 
        ]             
     }         
}

lerna中涉及的git命令

lerna中广泛使用了git命令用于内部工作，这里列举了lerna中使用的git命令。

git init
git rev-parse
git describe
git rev-list
git tag
git log
git config
git diff-index
git --version
git show
git am
git reset
git ls-files
git diff-tree
git commit
git ls-remote
git checkout
git push
git add
git remote
git show-ref

没有必要逐个介绍git命令，我们选取几个不是很常见的git命令介绍，了解其作用、lerna哪些命令用到了它们。

git rev-parse

主要用于解析git引用（如分支名称、标签名称等）或表达式，并输出对应的SHA-1值。它的作用包括但不限于：

解析提交、分支、标签等引用，获取对应的SHA-1值。

校验是否为有效的引用或表达式。

生成git对象的唯一标识符。

下面是一个git rev-parse命令的执行结果案例：

$ git rev-parse HEAD
f7f6d6f2b6b47eb8c4cf4b8bf5f83e0b8028c031

关联的lerna命令
lerna version：在执行版本升级操作时，lerna会使用git rev-parse来获取先前提交的哈希值作为上一个版本的参考。
lerna changed：用于列出自上次标记以来发生变更的包，可能会用到git rev-parse来比较不同提交之间的差异。
lerna diff：显示自上次标记以来的所有包的diff，也可能会使用git rev-parse来比较不同提交之间的差异。
lerna源码案例libs/commands/import/src/index.ts

getCurrentSHA() {
    return this.execSync("git", ["rev-parse", "HEAD"]);
}


getWorkspaceRoot() {
    return this.execSync("git", ["rev-parse", "--show-toplevel"]);
}

git describe

主要用于根据最接近的标签来描述当前提交的位置。它的作用包括但不限于：

找到最接近当前提交的标签。

根据最接近的标签以及提交的SHA-1值生成一个描述字符串。

可以帮助识别当前提交相对于标签的距离，以及提交是否是基于标签进行的修改。

下面是一个git describe命令的执行结果案例：

$ git describe
polaris-release-1.0.0-c12345

关联的lerna命令
lerna version：在执行版本升级操作时，lerna可能会使用git describe 来确定当前提交的位置，以便生成新的版本号。
lerna源码案例libs/commands/diff/src/lib/get-last-commit.ts

export function getLastCommit(execOpts?: ExecOptions) {
  if (hasTags(execOpts)) {
    log.silly("getLastTagInBranch", "");
    return childProcess.execSync("git", ["describe", "--tags", "--abbrev=0"], execOpts);
  }
  log.silly("getFirstCommit", "");
  return childProcess.execSync("git", ["rev-list", "--max-parents=0", "HEAD"], execOpts);
}

git rev-list

主要用于列出提交对象的SHA-1哈希值。它的作用包括但不限于：

列出提交对象的哈希值，可以按时间、作者、提交者等顺序进行排序。

支持使用范围、分支、标签等参数来限制输出的提交范围。

下面是一个git rev-list命令的执行结果案例：

$ git rev-list HEAD
f7f6d6f2b6b47eb8c4cf4b8bf5f83e0b8028c031
a3d8b4e1c2e1d0a9b8c6e5f7d6a4b3e8a1b2c3d4

这里git rev-list HEAD将列出当前HEAD指向的提交及其之前的所有提交的 SHA-1 哈希值。

关联的lerna命令
lerna changed：列出自上次标记以来发生变更的包，可能会使用git rev-list 来获取两个标记之间的提交列表。
lerna diff：显示自上次标记以来的所有包的diff，也可能会使用git rev-list 来获取两个标记之间的提交列表。
lerna 源码案例libs/commands/diff/src/lib/get-last-commit.ts

export function getLastCommit(execOpts?: ExecOptions) {
  if (hasTags(execOpts)) {
    log.silly("getLastTagInBranch", "");
    return childProcess.execSync("git", ["describe", "--tags", "--abbrev=0"], execOpts);
  }
  log.silly("getFirstCommit", "");
  return childProcess.execSync("git", ["rev-list", "--max-parents=0", "HEAD"], execOpts);
}

git diff-index

主要用于比较索引和工作树之间的差异，并将其输出为标准输出。它的作用包括但不限于：

检查暂存区（index）和当前工作目录之间的差异。

可以与不同的选项一起使用，以便输出不同格式的差异信息。

下面是一个git diff-index命令的执行结果案例：

$ git diff-index HEAD
:100644 100644 bcd1234... 0123456... M        file.txt

这里git diff-index HEAD将显示当前提交（HEAD）和工作目录之间的差异。

关联的lerna命令
lerna changed：列出自上次标记以来发生变更的包时，可能会用到git diff-index来比较索引和工作树之间的差异。
lerna源码案例libs/commands/import/src/index.ts

export class ImportCommand extends Command {
    ...
    if (this.execSync("git", ["diff-index", "HEAD"])) {
      throw new ValidationError("ECHANGES", "Local repository has un-committed changes");
    }
    ...
}

git diff-tree

主要用于比较两棵树之间的差异，并以特定的格式输出。它的作用包括但不限于：

比较两个树对象之间的差异，例如提交对象和树对象之间的差异。

可以用于查看提交之间的差异，文件的更改等信息。

下面是一个git diff-tree命令的执行结果案例：

$ git diff-tree HEAD~2 HEAD
100644 blob a3d8b4e1c2e1d0a9b8c6e5f7d6a4b3e8a1b2c3d4        file.txt

关联的lerna命令
lerna diff：显示自上次标记以来的所有包的diff时，可能会使用git diff-tree 来比较不同提交之间的差异。
lerna源码案例libs/commands/publish/src/lib/get-projects-with-tagged-packages.ts

export async function getProjectsWithTaggedPackages(
  projectNodes: ProjectGraphProjectNodeWithPackage[],
  projectFileMap: ProjectFileMap,
  execOpts: ExecOptions
): Promise {
  log.silly("getTaggedPackages", "");


  // @see https://stackoverflow.com/a/424142/5707
  // FIXME: --root is only necessary for tests :P
  const result = await childProcess.exec(
    "git",
    ["diff-tree", "--name-only", "--no-commit-id", "--root", "-r", "-c", "HEAD"],
    execOpts
  );


  const stdout: string = result.stdout;
  const files = new Set(stdout.split("\n"));


  return projectNodes.filter((node) => projectFileMap[node.name]?.some((file) => files.has(file.file)));
}

git show-ref

主要用于显示引用（如分支和标签）的名称和其对应的提交哈希值。它的作用包括但不限于：

列出git仓库中的所有引用及其对应的提交哈希值。

可以用于查看分支、标签等引用的信息。

下面是一个git show-ref命令的执行结果案例：

$ git show-ref
a3d8b4e1c2e1d0a9b8c6e5f7d6a4b3e8a1b2c3d4 HEAD
a3d8b4e1c2e1d0a9b8c6e5f7d6a4b3e8a1b2c3d4 refs/heads/main
f7f6d6f2b6b47eb8c4cf4b8bf5f83e0b8028c031 refs/tags/v1.0.0

关联的lerna命令
lerna version：在执行版本升级操作时，lerna可能会使用git show-ref 来获取引用的信息，以确定当前提交的位置。
lerna源码案例libs/commands/version/src/lib/remote-branch-exists.ts

export function remoteBranchExists(gitRemote: string, branch: string, opts: ExecOptions) {
  log.silly("remoteBranchExists", "");


  const remoteBranch = `${gitRemote}/${branch}`;


  try {
    childProcess.execSync("git", ["show-ref", "--verify", `refs/remotes/${remoteBranch}`], opts);
    return true;
  } catch (e) {
    return false;
  }
}

深入理解Babel 项目管理工具Lerna解析

一、背景

工程管理

代码风格

文档

质量控制

二、monorepo

什么是monorepo

monorepo的优缺点

优点

缺点

选择

三、lerna

lerna命令集

命令行列表

全局配置项

过滤器参数

--scope

--ignore

--no-private

--since [ref]

--exclude-dependents

--include-dependents

--include-dependencies

--include-merged-tags

lerna原理解析

文件结构

命令行注册

lerna/core/lerna/index.js

Commander类

import-local

依赖管理

lerna bootstrap

lerna bootstrap --hoist

yarn install

lerna.json

lerna中涉及的git命令

git rev-parse

git describe

通过php和Imagick实现图片的旋转和镜像

在Java中，如何设置列表的大小？

哪种语言可以取代Java？

Swoole实现高并发访问的wget

ABAP 程序中使用正则表达式验证邮箱格式是否正确