秒杀:用CDN把请求处理在服务器之外

2023年 8月 1日 53.4k 0

首先分享之前的所有文章 , 欢迎点赞收藏转发三连下次一定 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164…
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca…

一. 前言

后端程序员碰到这个概念的场景其实不多,我首次碰到还是在搭建自己博客网站的时候。

用最直观的场景来描述就是 : 买的服务器带宽太低,导致前端下载静态文件卡顿。

解决的方式是 : 将域名配置 CDN , 让静态文件获取不走后端服务器。

在高并发的系统中, CDN 可以帮助用户对静态文件分流,减少服务器负载.

二. 先看流程

2.1 原本的问题

  • 请求直接打到业务源服务器上面,占用资源(带宽,CPU,端口,内存等等)
  • 请求很难就近选择服务端,数据传输过程长,稳定性差,延时高
  • 恶意请求会直接打到服务器上,增加风险
  • 稳定性差,业务稳定性依赖于源服务器的可用性
  • 2.2 CDN 的处理流程

    image.png

  • 当用户向源域名 (image.a.com) 发起请求的时候,会发起 DNS 查询
  • DNS 基于源域名通过 CNAME 获取到 CDN 域名 (dns.a.com)
  • 请求在 CDN 服务节点中,通过智能路由选择最近的 CDN 节点 (PS :这一步也可以通过负载均衡 DNS 实现)
  • 用户获取解析IP 地址 , 向 IP 地址发起访问
  • 访问 CDN 节点如果没有缓存,则透传到源节点访问,同时回写 CDN
  • 关于智能路由

    智能路由是指根据用户的地理位置、网络状况和其他条件,动态地选择最优的 CDN 节点来提供内容。

    这个机制可以在 CDN 服务节点中实现,也可以在 DNS 服务集群中实现。从阿里藏经阁中找到的文档就能看到 :

    image.png

    通过 DNS 调度服务找到了对应最近的 IP ,再直接访问对应的 IP 地址。

    三. 再看使用

    以某云为例,当初几块钱搞了一个域名 :

    image.png

    先看专业术语

    • CDN : 内容分发网络 (Content Delivery Network)
    • 边缘节点 : 即 CDN 节点 ,本质上是部署在全球的服务器,用于缓存和分发内容
    • Cache 缓存 : 即 CDN 上缓存的请求内容
    • 源站 : 存储网站或应用程序内容的实际服务器
    • 回源 : 当用户请求的内容在 CDN 节点上没有缓存时,CDN 节点向源站服务器请求获取内容,并将其缓存到节点上
    • 缓存命中和缓存未命中 : 存在缓存时则为缓存命中
    • 清除缓存 : 当数据不正确时,需要把 CDN 节点上的内容清除
    • DDoS 防护 : 帮助抵御恶意的 DDoS 攻击

    四. 深入原理

    4.1 怎么把 CDN 配置到 DNS 里面

    第一步就是让请求打到 CDN 服务器 ,而不是源服务器。要实现这一步最终还是需要 DNS 的配合

    // 方式一 : CNAME 记录
    - 1. CDN 服务提供商提供一个用于 CDN 的域名
    - 2. 在 DNS 解析服务提供商 中配置 CNAME , 将源域名指向 CDN 域名
    - 3. DNS 辅助访问源域名时自动指向 CDN 域名 
    
    // 方式二 : A 记录
    - 1. 从 CDN 服务商处获取 CDN 节点的 IP 列表
    - 2. 将 IP 列表配置到 DNS 的 A 记录中,走常规的 DNS 解析 IP 的流程
    
    

    CNAME 是什么 ?

    • CNAME 是 DNS 记录类型之一,全称为“Canonical Name”(规范名字)
    • CNAME 是创建了一个域名的别名,将一个域名指向另外一个域名
    • 通过 CNAME 可以把加速域名指向 CDN 域名,这样 DNS 就能将请求解析到 CDN 域名

    A 记录是什么 ?

    • DNS 的基础概念,用于将域名映射到 IPv4 地址
    • 一个域名可以配置多个 IP 地址

    4.2 CDN 命中失败的原因

    • 客户端请求是动态请求
    • 源站返回强制不缓存的HTTP 头
    • 未返回响应头Etag 和Last-modified
    • 全站加速未配置静态加速

    4.3 CDN 缓存慢的原因

    • 刷新缓存,可能导致短时间内命中率下降。
    • 带宽突增,会导致CDN 节点回源较多,命中率会表现有下降趋势。
    • CDN 节点访问新内容,导致CDN 节点回源较多,命中率会表现有下降趋势。
    • 缓存规则调整,可能会影响命中率。

    五. 成本估算及场景

    5.1 成本估算

    • 参考国内的阿里云和腾讯云 ,10TB的 CDN 总量大概在 1200 左右
    • 掘金里面第一次访问一个页面的流量大概在3M左右 (后续访问会走本地缓存,这一块实际上不会走到 CDN)
    • 那么 10TB CDN 平均可以支持 300万 次单页面的访问 (假设忽略浏览器缓存和大图片)

    这个价格相比扩充带宽肯定是更划算的,带宽闲时供应商可不会给你减钱哦,同时处理网络请求带来的负载消耗也不小。

    看了一下掘金的 img 确实走的 CDN 。

    image.png

    5.2 适用场景

    • 静态文件缓存 : 如图片、样式表、脚本等
    • 流媒体和视频分发 : 分发流媒体和视频内容,减少视频加载时间和缓冲
      • (不过我感觉流媒体走 DNS 效果可能不好)
    • 动态内容加速 :应该是基于关键字进行缓存,功能肯定没有服务端的强大
    • 全球负载均衡 :根据用户的地理位置和网络状况,将请求路由到最优的服务器节点
    • 高峰期缓存预热 :支持缓存内容的刷新和预热,确保内容更新后能及时生效

    5.3 一般服务商会提供的功能

    • 访问控制 :白名单 、 盗链 、鉴权 、QPS 、限速 、端口限制 等等
    • 缓存规则 :基于缓存键 ,基于状态码 ,基于 HTTP 头部 ,缓存过期时间等等
    • 回源方式 : 分片 ,回源请求头配置 , 超时时间等等
    • HTTPS 配置 : 版本,配置等
    • 定制化 : 错误页面,指定状态码,压缩等等

    总结

    这篇是系列文章的第一篇,后续会陆陆续续把并发场景的知识点详细的过一遍。

    想做一个秒杀的全流程系列文章,只能做后端层面的压测,所以前端限制这一块只能通过概念的形式展现了~~

    CDN 原理了解就行,应用使用供应商的服务即可,基本上云开发商都提供了这些服务接口。

    扩展 :

    • 阿里藏经阁
    • 手写CDN基本原理-阿里云开发者社区 (aliyun.com)

    相关文章

    JavaScript2024新功能:Object.groupBy、正则表达式v标志
    PHP trim 函数对多字节字符的使用和限制
    新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
    使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
    为React 19做准备:WordPress 6.6用户指南
    如何删除WordPress中的所有评论

    发布评论