前言
在最近的工作和学习中,有一个词总是在眼前挥之不去--EventLoop。而在之前,其实我们讲过相关的内容,Event Loop 可视化解析
图片
上文我们从偏JS调用机制的角度分析了,调用栈(Call Stack)/宏任务队列 (Task Queue)和微任务队列 (Microtask Queue)他们之间的关系和他们是如何协同合作的。并且,举了很多例子,用可视化的方式讲解它们如何工作的。
而今天,我们从浏览器内部的实现细节来谈谈EventLoop是如何从接受任务到渲染出对应页面的。
也就是下图中所涉及到的各个重要节点。在阅读完本文后,希望大家能对下面有一个清晰的认知。
图片
好了,天不早了,干点正事哇。
我们能所学到的知识点
1. 前置知识点
「前置知识点」,只是做一个概念的介绍,不会做深度解释。因为,这些概念在下面文章中会有出现,为了让行文更加的顺畅,所以将本该在文内的概念解释放到前面来。「如果大家对这些概念熟悉,可以直接忽略」同时,由于阅读我文章的群体有很多,所以有些知识点可能「我视之若珍宝,尔视只如草芥,弃之如敝履」。以下知识点,请「酌情使用」。
页面刷新术语
我们在页面是如何生成的(宏观角度)一文中提到过这些指标,这里就拿来主义了。
- 「屏幕刷新频率」
一秒内屏幕刷新的次数(一秒内显示了多少帧的图像),单位 Hz(赫兹),如常见的 60 Hz。「刷新频率取决于硬件的固定参数」(不会变的)。
- 「逐行扫描」
-
显示器并不是一次性将画面显示到屏幕上,而是「从左到右边,从上到下逐行扫描」,顺序显示整屏的一个个像素点,不过这一过程快到人眼无法察觉到变化。
-
以 60 Hz 刷新率的屏幕为例,这一过程即 1000 / 60 ≈ 16ms。
-
当扫描完一个屏幕后,设备需要「重新回到第一行」以进入下一次的循环,此时有一段时间空隙,称为VerticalBlanking Interval(VBI)。
-
「帧率 (Frame Rate)」
-
表示 「GPU 在一秒内绘制操作的帧数」,如 60 fps,即每秒钟GPU最多绘制 60 帧画面。
-
帧率是「动态变化」的,例如当画面静止时,GPU 是没有绘制操作的,屏幕刷新的还是buffer中的数据,即GPU最后操作的帧数据。
-
「画面撕裂(tearing)」
-
一个屏幕内的数据来自2个不同的帧,画面会出现撕裂感。
测试帧率
我们可以借助requestAnimationFrame通过每个测量前后帧发生的时间间隔,来从侧面查看本地浏览器帧率。
const checkRequestAnimationDiff = () => {
let prev;
function call() {
requestAnimationFrame((timestamp) => {
if (prev) {
console.log(timestamp - prev);
// 应该大约是60FPS的16.6毫秒
}
prev = timestamp;
call();
});
}
call();
}
checkRequestAnimationDiff();
随意打开一个网站,并将上述代码贴到devtool-Console运行。
下面是,我们在React-官网[1]中实验的结果。
图片
从输出结果来看,虽然结果不是唯一,但是它们的值都稳定在16.67~16.68。和我们60fps是吻合的。
WebAPI
WebAPI工作的原理依赖于浏览器作为宿主环境来提供和执行这些API。在Web开发中,我们通常指的WebAPI是「浏览器内置的API」,它们允许开发者利用JavaScript与浏览器的功能进行交互。
APIs |
描述 |
网络请求 (Network Requests) |
使用 |
DOM操作 (DOM Manipulation) |
浏览器提供了一套DOM API,允许 |
事件处理 (Event Handling) |
WebAPI允许注册事件处理程序来响应用户行为(如点击、滑动)或浏览器事件(如页面加载、窗口尺寸变化)。 |
存储机制 (Storage Mechanisms) |
浏览器提供了如 |
设备API (Device APIs) |
可以访问设备的硬件,如摄像头、麦克风、地理位置等,这通常通过 |
图形和动画 (Graphics & Animation) |
|
性能监控 (Performance Monitoring) |
|
其他API (Other APIs) |
还有诸如 |
WebAPI的工作流程
在整个过程中,「浏览器的角色是中介」,它提供了执行API的环境和必要的安全措施。这些API让Web应用可以像本地应用一样丰富和强大,同时仍然运行在浏览器这个相对安全的沙箱环境中。
下面的图,展示了WebAPI的地位(中间部分)。
图片
GPU硬件加速
「GPU(Graphics Processing Unit)硬件加速」是一种利用GPU来执行图形和计算任务的技术。在Web开发中,GPU硬件加速可以通过利用用户计算机中的GPU资源来加速浏览器的渲染和绘制操作。这通常可以提高网页的性能和流畅度,尤其是对于需要大量图形操作的页面。
在Web开发中,一些CSS属性和操作可以触发GPU硬件加速,以便更有效地利用GPU资源。
使用transform属性进行3D变换,如translate3d、rotate3d、scale3d等,可以触发GPU硬件加速。例如:
.element {
transform: translate3d(0, 0, 0);
}
-
使用CSS动画和过渡属性,例如transform属性的过渡,可以触发GPU硬件加速。例如:
.element { transition: transform 0.3s ease-in-out; }
Canvas 绘图:
-
在元素上进行绘图操作通常会利用GPU硬件加速。这包括使用2D或WebGL上下文进行图形渲染。
使用 will-change 属性:
-
will-change属性告诉浏览器某个属性将会被改变,从而可以提前进行优化。例如:
.element { will-change: transform; }
使用 image-rendering 属性:
-
image-rendering属性用于指定图像的渲染质量,而且在某些情况下也能触发GPU硬件加速。例如:
.element { image-rendering: pixelated; }
使用 backface-visibility 属性:
-
backface-visibility属性用于指定当元素不面向屏幕时是否可见。在某些情况下,该属性的使用可以触发GPU硬件加速。例如:
.element { backface-visibility: hidden; }
使用 filter 属性(某些情况下):
-
在某些情况下,使用filter属性(如模糊、对比度等)可能触发GPU硬件加速。
还记得我们在你会在浏览器中打断点吗?我会!中介绍过如何看chromium 在线仓库[2]
那我们就从源码的角度来看看,为什么上面的属性会走GPU硬件加速
或者我们可以看compositing_reason_finder.cc这个文件,它例举了很多枚举类型。
图片
2. 事件循环(Event Loop)
事件循环就是一个「死循环」,不死不休。
旧的操作系统不支持多线程,它们的事件循环可以被大致描述为一个简单的循环:
while (true) {
if (hasTasks()) {
executeTask();
}
}
现代操作系统的调度器(schedulers)非常复杂。它们有优先级设置、执行队列等许多其他技术。
这里做一个题外话,看到schedulers/优先级设置是不是想到React-Fiber架构了。其实,React在内部就是模仿操作系统,做了自己的实现逻辑。(这里就不展开说明了)
为了让事情简单化,我们可以将事件循环(Event Loop)描述为一个循环,该循环检查是否有任何待处理的任务:
图片
任务触发器
浏览器属于「事件驱动」的技术框架,如果想让Event Loop探查并执行对应的任务,首先要做的就是将某些任务进行触发。也就是唤起指定任务的触发器。
下面就是我们平时能够接触到的任务触发器
setTimeout:设置一个计时器,在指定的延时后执行一段代码。
setInterval:设置一个计时器,按照指定的时间间隔重复执行一段代码。
requestIdleCallback:安排一个函数在浏览器空闲时期被调用。
用户触发的事件,例如click, mousedown, input, blur等。
代码生成的事件,比如XMLHttpRequest的响应处理、fetch API的promise resolve等。
「Promise状态变化」:当一个Promise对象的状态改变时(例如从pending变为fulfilled或rejected),相关的任务会被加入事件循环。
「观察者」:
DOMMutationObserver:用于观察DOM变动,当DOM发生变化时可以通知应用。
IntersectionObserver:用于观察元素是否进入了父元素或视口的特定区域。
requestAnimationFrame:用于在「下一次重新渲染前」执行动画或视觉更新的函数,使动画流畅。
上面的任务几乎都是通过WebAPI进行触发的。
例如,我们在代码中有这样一行:setTimeout(function a() {}, 100)。当我们执行setTimeout时,WebAPI将任务延迟了100毫秒。100毫秒后,WebAPI将函数a()放入任务队列(Task Queue)(也可以称为Callback Queue)中。事件循环在下一个循环中获取该任务并执行它。
JS执行和页面渲染是难兄难弟
EventLoop = TaskQueue + RenderQueue
在之前的文章中,我们提到过文档对象模型(DOM)是一个应用编程接口(API),通过创建表示文档的树,以一种「独立于平台和语言」的方式访问和修改一个页面的内容和结构。
在HTML文档中,Web开发者可以使用JS来CRUD DOM 结构,其主要的目的是「动态」改变HTML文档的结构。
- 读取DOM元素的数据:大小、属性、位置等
- 改变属性:data-属性、宽度、高度、位置、CSS属性等
- 创建/删除HTML节点
而在JS把玩DOM之后,就将其扔给了浏览器的渲染引擎,而渲染引擎任劳任怨的处理DOM和DOM携带的附带信息,并将其渲染成用户心仪的页面。
也就是说「JS和浏览器(渲染引擎)都能染指过DOM」。
基于上面的特定的背景,我们可以得出一个结论,执行JS和渲染页面都在同一个线程里。
这意味着事件循环包含渲染流程。而渲染流程不是单一的操作。其实,它是渲染队列:
图片
现在EventLoop处理链路上有两个任务源。
屏幕更新
对于浏览器来说,事件循环与帧(frames)密切相关,因为EventLoop同时执行JS代码并渲染页面。
可以将帧视为屏幕状态的快照,即用户在某一时刻看到的画面。
图片
我们在Chromium 最新渲染引擎--RenderingNG也介绍过frames。
图片
浏览器的目标是尽快显示页面更新,考虑到硬件和软件的限制:
- 硬件限制:屏幕刷新率
- 软件限制:操作系统设置、浏览器及其设置、节能设置等
绝大多数浏览器/操作系统支持60帧每秒(Frames Per Second,FPS)。浏览器试图以这个特定的速率更新屏幕。
当我们使用60 FPS时,这意味着浏览器在必须「渲染新帧之前有16.6毫秒的时间段来执行任务」(1000/60),而渲染新帧也会消耗时间。
3. 任务队列/微任务队列/调用栈
浏览器使用两个队列来执行我们的JS代码:
- 任务队列(TaskQueue)或宏任务队列专用于所有事件、延迟任务等。
- 微任务队列(Microtask Queue)用于处理 promise 回调(已解决和已拒绝),以及 MutationObserver。这个队列中的单个元素被称为 微任务。
任务队列(Task Queue)
当浏览器收到一个新任务时,它将任务放入任务队列。每个事件循环定期从任务队列中获取任务并执行它。任务完成后,「如果浏览器有时间(渲染队列没有任务),事件循环从任务队列获取另一个任务,直到渲染队列接收到任务为止」。
案例分析1
图片
我们有3个任务:A、B、C。事件循环获取并执行第一个任务,花费了4毫秒。然后事件循环检查其他队列(微任务队列和渲染队列),它们是空的。事件循环执行任务B,花费了12毫秒。总共两个任务使用了16毫秒。然后浏览器将任务添加到渲染队列以绘制新帧。事件循环检查渲染队列并开始执行渲染队列中的任务,它们大约花费1毫秒。完成这些操作后,事件循环返回到任务队列并执行最后一个任务C。
事件循环无法预测任务将花费多少时间。此外,事件循环「无法暂停任务来渲染帧」,因为浏览器引擎不知道该任务是否会对绘制内容有修改动作,还是任务只是为了渲染帧做了一些无关痛痒的准备工作。
在执行JS代码期间,「JS所做的所有更改并不会直接呈现给用户,而是等到宏任务和所有待处理的微任务完成后才会表现出来」。但是,此时在JS中可以获取到最新DOM的变更信息。
案例分析2
图片
队列中只有2个任务(A、B)。第一个任务A花费了240毫秒(无法中断)。由于60FPS意味着每16.6毫秒应该渲染一帧,所以浏览器有14帧的空窗期。当任务A结束时,事件循环执行渲染队列中的任务以绘制新帧。
「尽管我们失去了14帧,这并不意味着我们将连续渲染15帧。它只会渲染最后一帧」。
这就是当JS中有长任务执行时,会阻塞页面的渲染,如果这14帧中间操作了过多的DOM,页面中就会有一种从第一帧到第十五帧的跳动。这就是为什么我们总是要将长任务拆分成很多小任务的原因。
调用栈(Call Stack)
在Event Loop 可视化解析讲解中我们对调用栈有过介绍。
图片
案例分析
function D() {
debugger;
console.log('前端柒八九');
}
function C() {
D();
}
function B() {
C();
}
function other() {
// 不在我们考察堆栈上下文中
}
function A() {
const arr = [];
while (arr.length < 2) {
arr.push(other());
}
B();
}
console.log(A());
将上面的代码贴到devTool-Console或者devTool-Source-Snippet中执行。这段代码将在debugger处暂停。
这里多提一嘴,关于如何在浏览器中优雅的调试断点,可以参考你会在浏览器中打断点吗?我会!
- console.log(A());,它是调用栈的开始。
- 然后我们进入 A 函数,并多次调用 other。在我们到达debugger之前,这个函数不会出现在调用栈中,因为它在我们到达调试器之前就结束了。
这是我们在debugger停止时调用栈的样子:
图片
图中(anonymous)表示全局作用域,我们没贴出来,它就是指向25行调用栈的入口的。
当调用栈为空时,「当前任务」完成。
微任务
微任务只有两个可能的来源:
微任务有一个主要特征,使它们与其他任务完全不同:
一旦调用栈为空,微任务将立即执行。
微任务可以创建其他微任务,「这些微任务将在调用栈结束时执行」。每个「新的微任务都会推迟执行新的宏任务或新帧的渲染」。
案例分析
在这个例子中,微任务队列中有4个微任务:
图片
要执行的第一个微任务是A。A花费了200毫秒,而且我们在渲染队列中有任务。然而,它们将被推迟,因为我们仍然有3个微任务。这意味着在执行A后,事件循环将执行微任务B、C,最后是D。当「微任务队列变空时,事件循环渲染新帧」。在这个例子中,这4个微任务花费了0.5秒。在这段时间内,浏览器「UI被阻塞,不可交互」。
后续的微任务可以阻塞网站UI,使页面变得不可交互。
这个微任务特性既可能是优势也可能是劣势。例如,当 MutationObserver 根据DOM更改调用其回调时,用户在回调完成之前看不到页面上的更改。因此,我们可以有效地管理用户看到的内容。
更新后的事件循环图示:
图片
各自的特性
- 调用栈是用于跟踪「正在被执行」函数的机制,而宏任务队列是用于跟踪「将要被执行」函数的机制。
- 宏任务队列和微任务队列都是「FIFO」(先进先出)的队列结构,这些任务是「同步阻塞」的
4. 在渲染队列中执行的是什么?
其实,在浏览器中渲染页面是有很多步骤的。
同时还涉及多个进程之间的通信。这在之前的页面是如何生成的(宏观角度)有过介绍,这里就不在罗嗦了。
而今天呢,我们从浏览器渲染帧的角度来看到底发生了啥?!其实帧渲染不是一个单一的操作,它有几个阶段,每个阶段都可以分为子阶段。
新帧渲染的基本结构
RequestAnimationFrame(RAF)
图片
requestAnimationFrame 是一个由浏览器提供的 JavaScript API,用于在下一次「浏览器重绘之前」执行指定的函数。这个函数通常用于执行动画或其他需要高性能更新的任务,因为它会在浏览器的绘制周期内运行,以确保动画的平滑流畅。
特点
样式重新计算(Recalc Style)
图片
浏览器重新计算应用的样式。此步骤还会计算哪些媒体查询将处于活动状态。
以下操作能触发重新计算包括
- 直接更改,比如 a.styles.left = '10px'
- 通过CSS文件描述的更改,比如 element.classList.add('my-styles-class')。
此过程可能触发整个DOM树的整体计算也可以是局部小范围的计算过程,取决于「被改动的元素的位置」。
- 例如,改动body元素的属性,就会发生整个DOM树的重新计算。
图片
将元素样式和DOM元素结合起来,就会生成Render Tree
我们可以通过devTool-Performance来检测网站在这步所花费的时间。
图片
React官网-样式重新计算所花费时间
布局(Layout)
计算每个「可视元素」的位置信息(距离视口的距离和元素本身大小)。并生成对应的Layout Tree。 页面上的DOM元素越多,操作就越复杂。
图片
React官网-布局所花费时间
触发条件
对于现今「富应用」来讲,做页面中做元素的移动和变更那是家常便饭。以下操作就会触发对应的布局流程
- 读取与元素的大小和位置相关的属性(offsetWidth、offsetLeft、getBoundingClientRect等)。
- 写入与元素的大小和位置相关的属性,除了某些属性(例如 transform 和 will-change)。
这里,我们用一点篇幅来讲一下为何transform/will-change能跳过布局阶段,直接进入合成阶段。
在之前的Chromium 最新渲染引擎--RenderingNG我们讲过,在渲染流程的最开始其实是还有一个步骤叫做animate。
图片
在渲染流程的图中,用不同颜色来标识该阶段可能会被不同的线程或者进程所执行。
颜色 |
所在进程/线程 |
绿色 |
渲染进程中的主线程 |
黄色 |
渲染进程中的合成线程 |
橘色 |
viz进程(也叫GPU进程) |
在某些阶段,可能会被多个地方所执行,所以该阶段可能存在多个颜色。
而animate存在两个颜色(绿色和黄色)也就是这一步,会在多个地方被执行。
而让animate能够在黄色阶段,也就是在合成线程中执行,就是我们使用了一些CSS3属性
使用了这些属性后,会跳过前面很多的步骤,例如重新计算样式/布局/重绘等阶段。并且,在合成线程进行数据转换后,开启GPU的「硬件加速」。
就这速度,你说能不快吗。
其实,上面的内容在大部分教程中,都是一种铁打不动的定律。使用了transform/will-change开启了GPU硬件加速,所以性能提升了。
强制布局
强制布局(Forced Synchronous Layout 或 Forced Reflow)是Web性能优化领域的一个术语,它指的是浏览器在能够继续「处理后续操作之前,必须完成当前的布局计算」。
当强制执行布局时,浏览器会暂停JS主线程,尽管调用栈不是空的。
有很多我们耳熟能详的操作,都会触发强制布局。
图片
想了解更多👉触发强制布局的操作[4]。
案例分析
div1.style.height = "200px"; // 更改元素大小
var height1 = div1.clientHeight; // 读取属性
浏览器无法在不重新计算其实际大小的情况下计算div1的clientHeight。在这种情况下,浏览器暂停JS执行并运行:样式以查看应该更改什么,以及布局以重新计算大小。布局不仅计算放置在div1之前的元素,还计算放置在div1之后的元素。现代浏览器通过优化计算,使得在每次都不必重新计算整个DOM树,但在糟糕的情况下仍然会发生。重新计算的过程称为「layout shift」。
图片
浏览器尽量不在每次都强制执行布局。因此,它们对操作进行分组:
div1.style.height = "200px";
var height1 = div1.clientHeight; //