虽然机器检查异常(MCE)事件往往不常见,但英特尔工程师所做的一项改变是在Linux内核中提供了一种能力,即在越来越高的内核数量的服务器上存储更多的机器检查记录,以“当出现严重错误时”。
Linux内核现在已经维护了一个内存池,可以存储80条机器检查异常记录,但英特尔的Tony Luck提高了容纳越来越大的服务器处理器的阈值:
“当出现严重错误时,拥有大量CPU的系统可能会生成大量的机器检查记录。但Linux有一个固定的缓冲区,只能捕获几十个错误。
根据CPU的数量分配空间(最小值基于可以存储80条记录的历史固定缓冲区)。"
Linux 6.10中实现的新行为是保持池大小至少为80条记录,或者每个CPU核心至少有两条记录,以较大者为准。。。换句话说,在具有40个或更多CPU核的Linux 6.10+系统上,当系统状态出现问题时,将看到用于存储MCE记录的扩展池。
The change was merged as the only RAS updates for Linux 6.10.