SaaS多租户可伸缩的数据隔离方案

2023年 7月 14日开发运维向阳逐梦

一、SaaS背景

SaaS 是一个全球性趋势，在 SaaS 领域也诞生了众多全球化的公司。现在越来越多的公司开始去做Saas了，作为技术er来讲最重要的是保证系统的数据隔离性、稳定性、安全性、扩展性。其中，数据隔离一个就是我们首要要解决的第一问题，随着数据量的增加，数据库的扩展性是一个技术卡点。相对于应用服务器层的水平扩展，数据库层的水平扩展更难实现。笔者就数据隔离问题提出一些解决思路、以及具体的解决方案，以便你在设计SaaS系统时有一个参考。

二、解决方案

1.共享数据库、共享数据表

在项目的初期，或者Saas租户数据不是很大的情况下，这个方案是实施最快、复杂度最低的一个。这个方案只需要在每个表里面添加一个tenant_id列，每次写入、查询的时候都带上tenantId，就很轻松的实现了数据隔离。
由于所有的租户相同类型数据都是存放在同一张表里面的，当数据达到千万级别时会导致查询性能直线下降。

2.共享数据库、不同的数据表

图片.png

由于前面这种方案有一个致命的问题，就是相同数据存储在同一个表里，数据的查询性能受到极大限制。于是乎，优秀的开发工程师们想到了另外一个方案：使用相同的database，但是租户的数据可以存放在不同的表里面，这样就解决了呀（可以一个租户对应一套表，也可以将多个租户对应一套表）。

Schema隔离使用PostgreSQL来实现非常简单，因为他天生支持这种方式，具体可以去PostgreSQL了解。

虽解决了单表数据容量的问题，随着租户的用户量越来多时，我们的查询请求呈线性增长，此时我们可以通过数据库的主从方式来解决。但是当租户的写入请求变大时，这个方案的性能瓶颈就卡在主库了。此外，这种模式没办法去解决部分大流量租户吸血问题（突入起来的流量暴增），导致影响其他租户的使用体验。

3.独立数据库（每个租户一个数据库，多个租户对应一个数据库）

为了解决前面提到的问题，架构师们将问题向上抽象了一下，将问题提升到db这层来解决。这里面有细分两种方案：

1).每一个租户一个数据库

图片.png
这个隔离方案很安全、数据互相不受影响、性能也不受影响，但是成本相当昂贵，这个适用于超级有钱的大户使用。

2).通过规则，将一群租户统一放在一个数据库里(推荐)

图片.png

通过规则，我们可以通过后台配置设定规则，将一批租户的数据存放在一个数据库中，将流量大的租户单独隔离出来，这样就完美解决了租户前面提到的大表问题、部分大流量租户吸血问题，让他们实现请求、存储隔离。
这个方案相比前面的几种方案，在扩展性、隔离性、安全性上的表现都是最优的，但是实现复杂度较大。

4.综合对比

对比.png

三、实操

1.隐藏陷阱

如果应用规模进一步扩大，租户数量在持续增加，应用服务器层和数据库层都在持续地水平扩展。再增加新的服务器的话，该架构还是存在一丝隐患的。由于数据库连接是一种创建成本较高且较为稀缺的资源，而上述架构中的每台应用服务器需要连接到每台数据库服务器上。这样，当应用服务器数量扩展到一定数量时，数据库服务器的连接数将可能成为系统的瓶颈。
出现这个问题的原因是，尽管应用服务器层和数据库层已经分别实现了水平扩展，但是由于其彼此之间没有任何对应关系，导致所有的应用服务器要与所有的数据库服务器关联(以m 台应用服务器和n 台数据库服务器为例，它们之间的关联有 mxn 个，也是就是每台应用服务器至少要有n个数据库链接 )。

2. 解决

要解决这个问题，只需对上面的架构做出微小的调整。所有的应用服务器不应该是完全平等的，应该与数据库服务器对应。也就是说，不同的租户可能不仅有不同的应用服务器，还有可能有不同的数据库服务器。每组应用服务器都仅连接对应的数据库服务器。调整后的整体架构模型如下：
图片.png

3.具体实现

要实现将同一应用的不同实例链接到不同的数据库节点上，我们需要通个配置规则，在应用启动的时候，读取配置文件内容，然后获取该节点链接数据库的配置信息。这个配置文件，可以是项目本地也可以使用配置中心来实现，推荐使用配置中心来完成，因为这个在分布式上很有优势且可以做成可视化界面操作。

我们用项目本地文件为例子来实现：
application.yml

#数据库配置
node.mapping: 127.0.0.1,db-1;192.168.12.1,db-2;

spring:
  datasource:
   node:
     -
        db-1:
        username: abc
        password: abc@123
        url: jdbc:mysql://xxxx:3306/xxx?useUnicode=true&characterEncoding=UTF-8&useSSL=false
        driver-class-name: com.mysql.jdbc.Driver 
     -
        db-2:
        username: 2b
        password: 2p
        url: 2u
        driver-class-name: com.mysql.jdbc.Driver 
server:
  port: 9999

spring.application.name: tenants-test

dataSource核心配置：

package com.example.config;

import lombok.Data;

/**
 * @author 
 *
 */

@Data
public class DataSourceInfo {
    private String nodeName;
    private String url;
    private String username;
    private String password;
}

@Data
@ConfigurationProperties(prefix = "spring.datasource")
@Configuration
public class CustomerDataSourceProperties {

    private List node;

}

package com.example.config;

import com.alibaba.druid.pool.DruidDataSource;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.context.properties.EnableConfigurationProperties;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

import javax.sql.DataSource;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * 
 */

@EnableConfigurationProperties(value = CustomerDataSourceProperties.class)
@Configuration
public class MultiTenantConfiguration {

    /**
     * node.mapping : 192.168.1.2,mysql1;192.168.1.2,mysql2; spring.data.driver.mysql1: xxx data.url.mysql1: xxx
     * data.username.mysql1: xxx data.password.mysql1: xxx
     *
     * @param
     * @return
     */

    @Autowired
    private CustomerDataSourceProperties customerDataSourceProperties;

    @Bean
    public DataSource getDataSource(@Value("${node.mapping}") String dataMapping) {
        String dbName = getDbInfo(dataMapping);
        Map dataSourceInfoMap = getAllDataSourceInfo();
        DataSourceInfo dataSourceInfo = dataSourceInfoMap.get(dbName);

        DruidDataSource druidDataSource = new DruidDataSource();
        druidDataSource.setUrl(dataSourceInfo.getUrl());
        druidDataSource.setUsername(dataSourceInfo.getUsername());
        druidDataSource.setPassword(dataSourceInfo.getPassword());
        druidDataSource.setDriverClassName("com.mysql.jdbc.Driver");
        return druidDataSource;
    }

    private Map getAllDataSourceInfo() {
        List data = customerDataSourceProperties.getNode();
        Map dataSourceInfos = new HashMap();
        for (Map map : data) {
            DataSourceInfo dataSourceInfo = new DataSourceInfo();
            map.forEach((key, value) -> {
                if ("username".equalsIgnoreCase(key)) {
                    dataSourceInfo.setUsername(value);
                } else if ("password".equalsIgnoreCase(key)) {
                    dataSourceInfo.setPassword(value);
                } else if ("url".equalsIgnoreCase(key)) {
                    dataSourceInfo.setUrl(value);
                } else if (key.startsWith("db-")) {
                    dataSourceInfo.setNodeName(key);
                }
            });
            dataSourceInfos.put(dataSourceInfo.getNodeName(), dataSourceInfo);
        }
        return dataSourceInfos;
    }

    private String getDbInfo(String dataMapping) {
        String ip = "127.0.0.1";
        String[] dataMappingArray = dataMapping.split(";");
        for (String mapping : dataMappingArray) {
            String[] kvArray = mapping.split(",");
            if (ip.equalsIgnoreCase(kvArray[0])) {
                return kvArray[1];
            }
        }

        return null;
    }
}

我们将应用程序的节点ip和数据库进行配置绑定，这里在k8s环境下会有问题，因为每次pod重启ip会发生改变。在云原生场景下，我们可以通过hostname和数据库进行映射方式来解决。

应用层和数据库层的水平扩展只是应用可伸缩性的一部分，上面提到的几种实现伸缩性的方案，也仅仅是 SaaS 应用中最常用的方案。对于更大型、更复杂的应用，可能需要更为通用的分布式解决方案。这些方案不仅仅适用于 SaaS 应用，而且普遍适用于大型互联网应用。

作者：向阳逐梦

链接：https://www.mryunwei.com/222008.html

文章版权归作者所有，未经允许请勿转载。